Claude Agent SDK предоставляет подробную информацию об использовании токенов для каждого взаимодействия с Claude. Это руководство объясняет, как правильно отслеживать затраты и понимать отчетность об использовании, особенно при работе с параллельным использованием инструментов и многошаговыми диалогами.
Полную документацию API см. в справочнике TypeScript SDK.
Когда Claude обрабатывает запросы, он сообщает об использовании токенов на уровне сообщения. Эти данные об использовании необходимы для отслеживания затрат и надлежащего выставления счетов пользователям.
Когда Claude выполняет инструменты, отчетность об использовании различается в зависимости от того, выполняются ли инструменты последовательно или параллельно:
import { query } from "@anthropic-ai/claude-agent-sdk";
// Пример: Отслеживание использования в диалоге
const result = await query({
prompt: "Analyze this codebase and run tests",
options: {
onMessage: (message) => {
if (message.type === 'assistant' && message.usage) {
console.log(`Message ID: ${message.id}`);
console.log(`Usage:`, message.usage);
}
}
}
});Вот как сообщения и использование сообщаются в типичном многошаговом диалоге:
<!-- Шаг 1: Начальный запрос с параллельным использованием инструментов -->
assistant (text) { id: "msg_1", usage: { output_tokens: 100, ... } }
assistant (tool_use) { id: "msg_1", usage: { output_tokens: 100, ... } }
assistant (tool_use) { id: "msg_1", usage: { output_tokens: 100, ... } }
assistant (tool_use) { id: "msg_1", usage: { output_tokens: 100, ... } }
user (tool_result)
user (tool_result)
user (tool_result)
<!-- Шаг 2: Ответ на продолжение -->
assistant (text) { id: "msg_2", usage: { output_tokens: 98, ... } }Все сообщения с одинаковым полем id сообщают об идентичном использовании. Когда Claude отправляет несколько сообщений в одном ходу (например, текст + использование инструментов), они имеют одинаковый ID сообщения и данные об использовании.
// Все эти сообщения имеют одинаковый ID и использование
const messages = [
{ type: 'assistant', id: 'msg_123', usage: { output_tokens: 100 } },
{ type: 'assistant', id: 'msg_123', usage: { output_tokens: 100 } },
{ type: 'assistant', id: 'msg_123', usage: { output_tokens: 100 } }
];
// Взимайте плату только один раз за уникальный ID сообщения
const uniqueUsage = messages[0].usage; // То же самое для всех сообщений с этим IDВы должны взимать плату с пользователей только один раз за шаг, а не за каждое отдельное сообщение. Когда вы видите несколько сообщений помощника с одинаковым ID, используйте использование из любого из них.
Финальное сообщение result содержит общее кумулятивное использование из всех шагов в диалоге:
// Финальный результат включает общее использование
const result = await query({
prompt: "Multi-step task",
options: { /* ... */ }
});
console.log("Total usage:", result.usage);
console.log("Total cost:", result.usage.total_cost_usd);Сообщение результата также включает modelUsage, которое предоставляет авторитетные данные об использовании для каждой модели. Как и total_cost_usd, это поле точно и подходит для целей выставления счетов. Это особенно полезно при использовании нескольких моделей (например, Haiku для подагентов, Opus для основного агента).
// modelUsage предоставляет разбивку по моделям
type ModelUsage = {
inputTokens: number
outputTokens: number
cacheReadInputTokens: number
cacheCreationInputTokens: number
webSearchRequests: number
costUSD: number
contextWindow: number
}
// Доступ из сообщения результата
const result = await query({ prompt: "..." });
// result.modelUsage — это карта имени модели на ModelUsage
for (const [modelName, usage] of Object.entries(result.modelUsage)) {
console.log(`${modelName}: $${usage.costUSD.toFixed(4)}`);
console.log(` Input tokens: ${usage.inputTokens}`);
console.log(` Output tokens: ${usage.outputTokens}`);
}Полные определения типов см. в справочнике TypeScript SDK.
Вот полный пример реализации системы отслеживания затрат:
import { query } from "@anthropic-ai/claude-agent-sdk";
class CostTracker {
private processedMessageIds = new Set<string>();
private stepUsages: Array<any> = [];
async trackConversation(prompt: string) {
const result = await query({
prompt,
options: {
onMessage: (message) => {
this.processMessage(message);
}
}
});
return {
result,
stepUsages: this.stepUsages,
totalCost: result.usage?.total_cost_usd || 0
};
}
private processMessage(message: any) {
// Обработка только сообщений помощника с использованием
if (message.type !== 'assistant' || !message.usage) {
return;
}
// Пропустить, если мы уже обработали этот ID сообщения
if (this.processedMessageIds.has(message.id)) {
return;
}
// Отметить как обработанное и записать использование
this.processedMessageIds.add(message.id);
this.stepUsages.push({
messageId: message.id,
timestamp: new Date().toISOString(),
usage: message.usage,
costUSD: this.calculateCost(message.usage)
});
}
private calculateCost(usage: any): number {
// Реализуйте расчет цены здесь
// Это упрощенный пример
const inputCost = usage.input_tokens * 0.00003;
const outputCost = usage.output_tokens * 0.00015;
const cacheReadCost = (usage.cache_read_input_tokens || 0) * 0.0000075;
return inputCost + outputCost + cacheReadCost;
}
}
// Использование
const tracker = new CostTracker();
const { result, stepUsages, totalCost } = await tracker.trackConversation(
"Analyze and refactor this code"
);
console.log(`Steps processed: ${stepUsages.length}`);
console.log(`Total cost: $${totalCost.toFixed(4)}`);В редких случаях вы можете заметить различные значения output_tokens для сообщений с одинаковым ID. Когда это происходит:
total_cost_usd в сообщении результата является авторитетнымПри использовании кэширования подсказок отслеживайте эти типы токенов отдельно:
interface CacheUsage {
cache_creation_input_tokens: number;
cache_read_input_tokens: number;
cache_creation: {
ephemeral_5m_input_tokens: number;
ephemeral_1h_input_tokens: number;
};
}Каждый объект использования содержит:
input_tokens: Базовые входные токены, обработанныеoutput_tokens: Токены, сгенерированные в ответеcache_creation_input_tokens: Токены, используемые для создания записей кэшаcache_read_input_tokens: Токены, прочитанные из кэшаservice_tier: Используемый уровень обслуживания (например, "standard")total_cost_usd: Общая стоимость в USD (только в сообщении результата)Вот как агрегировать данные об использовании для панели выставления счетов:
class BillingAggregator {
private userUsage = new Map<string, {
totalTokens: number;
totalCost: number;
conversations: number;
}>();
async processUserRequest(userId: string, prompt: string) {
const tracker = new CostTracker();
const { result, stepUsages, totalCost } = await tracker.trackConversation(prompt);
// Обновить итоги пользователя
const current = this.userUsage.get(userId) || {
totalTokens: 0,
totalCost: 0,
conversations: 0
};
const totalTokens = stepUsages.reduce((sum, step) =>
sum + step.usage.input_tokens + step.usage.output_tokens, 0
);
this.userUsage.set(userId, {
totalTokens: current.totalTokens + totalTokens,
totalCost: current.totalCost + totalCost,
conversations: current.conversations + 1
});
return result;
}
getUserBilling(userId: string) {
return this.userUsage.get(userId) || {
totalTokens: 0,
totalCost: 0,
conversations: 0
};
}
}Was this page helpful?