Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contexto
    Capacidades
    Almacenamiento en caché de promptsPensamiento extendidoPensamiento adaptativoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoSDK de TypeScriptTypeScript V2 (vista previa)SDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de Claude Code AnalyticsRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Administración y monitoreo

    API de Uso y Costo

    Accede programáticamente a los datos de uso y costo de la API de tu organización con la API de Administración de Uso y Costo.

    The Admin API is unavailable for individual accounts. To collaborate with teammates and add members, set up your organization in Console → Settings → Organization.

    La API de Administración de Uso y Costo proporciona acceso programático y granular a datos históricos de uso y costo de la API para tu organización. Estos datos son similares a la información disponible en las páginas de Uso y Costo de la Consola de Claude.

    Esta API te permite monitorear, analizar y optimizar mejor tus implementaciones de Claude:

    • Seguimiento Preciso del Uso: Obtén conteos exactos de tokens y patrones de uso en lugar de depender únicamente del conteo de tokens de respuesta
    • Reconciliación de Costos: Haz coincidir registros internos con la facturación de Anthropic para equipos de finanzas y contabilidad
    • Rendimiento del producto y mejora: Monitorea el rendimiento del producto mientras mides si los cambios en el sistema lo han mejorado, o configura alertas
    • Optimización de límite de velocidad y Nivel de Prioridad: Optimiza características como almacenamiento en caché de prompts o prompts específicos para aprovechar al máximo tu capacidad asignada, o compra capacidad dedicada.
    • Análisis Avanzado: Realiza análisis de datos más profundos que los disponibles en la Consola

    Se requiere clave de API de administración

    Esta API es parte de la API de Administración. Estos endpoints requieren una clave de API de administración (que comienza con sk-ant-admin...) que difiere de las claves de API estándar. Solo los miembros de la organización con el rol de administrador pueden aprovisionar claves de API de administración a través de la Consola de Claude.

    Soluciones de socios

    Las principales plataformas de observabilidad ofrecen integraciones listas para usar para monitorear tu uso y costo de la API de Claude, sin necesidad de escribir código personalizado. Estas integraciones proporcionan paneles de control, alertas y análisis para ayudarte a gestionar tu uso de la API de manera efectiva.

    CloudZero

    Plataforma de inteligencia en la nube para rastrear y pronosticar costos

    Datadog

    Observabilidad de LLM con rastreo y monitoreo automáticos

    Grafana Cloud

    Integración sin agente para una observabilidad fácil de LLM con paneles de control y alertas listos para usar

    Honeycomb

    Consultas avanzadas y visualización a través de OpenTelemetry

    Vantage

    Plataforma FinOps para observabilidad de costo y uso de LLM

    Inicio rápido

    Obtén el uso diario de tu organización para los últimos 7 días:

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-08T00:00:00Z&\
    ending_at=2025-01-15T00:00:00Z&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Establece un encabezado User-Agent para integraciones

    Si estás construyendo una integración, establece tu encabezado User-Agent para ayudarnos a entender los patrones de uso:

    User-Agent: YourApp/1.0.0 (https://yourapp.com)

    API de Uso

    Rastrea el consumo de tokens en toda tu organización con desgloses detallados por modelo, espacio de trabajo y nivel de servicio con el endpoint /v1/organizations/usage_report/messages.

    Conceptos clave

    • Buckets de tiempo: Agrega datos de uso en intervalos fijos (1m, 1h, o 1d)
    • Seguimiento de tokens: Mide tokens de entrada sin caché, entrada en caché, creación de caché y tokens de salida
    • Filtrado y agrupación: Filtra por clave de API, espacio de trabajo, modelo, nivel de servicio, ventana de contexto, o residencia de datos, y agrupa resultados por estas dimensiones
    • Uso de herramientas del servidor: Rastrea el uso de herramientas del lado del servidor como búsqueda web

    Para detalles completos de parámetros y esquemas de respuesta, consulta la referencia de la API de Uso.

    Ejemplos básicos

    Uso diario por modelo

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-08T00:00:00Z&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Uso por hora con filtrado

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-15T00:00:00Z&\
    ending_at=2025-01-15T23:59:59Z&\
    models[]=claude-opus-4-6&\
    service_tiers[]=batch&\
    context_window[]=0-200k&\
    bucket_width=1h" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Filtra el uso por claves de API y espacios de trabajo

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-08T00:00:00Z&\
    api_key_ids[]=apikey_01Rj2N8SVvo6BePZj99NhmiT&\
    api_key_ids[]=apikey_01ABC123DEF456GHI789JKL&\
    workspace_ids[]=wrkspc_01JwQvzr7rXLA5AGx3HKfFUJ&\
    workspace_ids[]=wrkspc_01XYZ789ABC123DEF456MNO&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Para recuperar los IDs de clave de API de tu organización, usa el endpoint Listar Claves de API.

    Para recuperar los IDs de espacio de trabajo de tu organización, usa el endpoint Listar Espacios de Trabajo, o encuentra los IDs de espacio de trabajo de tu organización en la Consola de Anthropic.

    Residencia de datos

    Rastrea tus controles de residencia de datos agrupando y filtrando el uso con la dimensión inference_geo. Esto es útil para verificar el enrutamiento geográfico en toda tu organización.

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2026-02-01T00:00:00Z&\
    ending_at=2026-02-08T00:00:00Z&\
    group_by[]=inference_geo&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    También puedes filtrar a una geografía específica. Los valores válidos son global, us, y not_available:

    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2026-02-01T00:00:00Z&\
    ending_at=2026-02-08T00:00:00Z&\
    inference_geos[]=us&\
    group_by[]=model&\
    bucket_width=1d" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Los modelos lanzados antes de febrero de 2026 (anteriores a Claude Opus 4.6) no admiten el parámetro de solicitud inference_geo, por lo que sus informes de uso devuelven "not_available" para esta dimensión. Puedes usar not_available como valor de filtro en inference_geos[] para dirigirse a esos modelos.

    Límites de granularidad de tiempo

    GranularidadLímite PredeterminadoLímite MáximoCaso de Uso
    1m60 buckets1440 bucketsMonitoreo en tiempo real
    1h24 buckets168 bucketsPatrones diarios
    1d7 buckets31 bucketsInformes semanales/mensuales

    API de Costo

    Recupera desgloses de costo a nivel de servicio en USD con el endpoint /v1/organizations/cost_report.

    Conceptos clave

    • Moneda: Todos los costos en USD, reportados como cadenas decimales en unidades más bajas (centavos)
    • Tipos de costo: Rastrea costos de uso de tokens, búsqueda web y ejecución de código
    • Agrupación: Agrupa costos por espacio de trabajo o descripción para desgloses detallados. Al agrupar por description, las respuestas incluyen campos analizados como model e inference_geo
    • Buckets de tiempo: Solo granularidad diaria (1d)

    Para detalles completos de parámetros y esquemas de respuesta, consulta la referencia de la API de Costo.

    Los costos del Nivel de Prioridad utilizan un modelo de facturación diferente y no se incluyen en el endpoint de costo. Rastrea el uso del Nivel de Prioridad a través del endpoint de uso en su lugar.

    Ejemplo básico

    curl "https://api.anthropic.com/v1/organizations/cost_report?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    group_by[]=workspace_id&\
    group_by[]=description" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Paginación

    Ambos endpoints admiten paginación para conjuntos de datos grandes:

    1. Realiza tu solicitud inicial
    2. Si has_more es true, usa el valor next_page en tu siguiente solicitud
    3. Continúa hasta que has_more sea false
    # Primera solicitud
    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    limit=7" \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"
    
    # La respuesta incluye: "has_more": true, "next_page": "page_xyz..."
    
    # Siguiente solicitud con paginación
    curl "https://api.anthropic.com/v1/organizations/usage_report/messages?\
    starting_at=2025-01-01T00:00:00Z&\
    ending_at=2025-01-31T00:00:00Z&\
    limit=7&\
    page=page_xyz..." \
      --header "anthropic-version: 2023-06-01" \
      --header "x-api-key: $ADMIN_API_KEY"

    Casos de uso comunes

    Explora implementaciones detalladas en Claude Cookbook:

    • Informes de uso diario: Rastrea tendencias de consumo de tokens
    • Atribución de costos: Asigna gastos por espacio de trabajo para contracargos
    • Eficiencia de caché: Mide y optimiza el almacenamiento en caché de prompts
    • Monitoreo de presupuesto: Configura alertas para umbrales de gasto
    • Exportación CSV: Genera informes para equipos de finanzas

    Preguntas frecuentes

    ¿Qué tan frescos son los datos?

    Los datos de uso y costo generalmente aparecen dentro de 5 minutos después de la finalización de la solicitud de la API, aunque los retrasos ocasionalmente pueden ser más largos.

    ¿Cuál es la frecuencia de sondeo recomendada?

    La API admite sondeo una vez por minuto para uso sostenido. Para ráfagas cortas (por ejemplo, descargar datos paginados), el sondeo más frecuente es aceptable. Almacena en caché los resultados para paneles de control que necesitan actualizaciones frecuentes.

    ¿Cómo rastro el uso de ejecución de código?

    Los costos de ejecución de código aparecen en el endpoint de costo agrupados bajo Code Execution Usage en el campo de descripción. La ejecución de código no se incluye en el endpoint de uso.

    ¿Cómo rastro el uso del Nivel de Prioridad?

    Filtra o agrupa por service_tier en el endpoint de uso y busca el valor priority. Los costos del Nivel de Prioridad no están disponibles en el endpoint de costo.

    ¿Qué sucede con el uso de Workbench?

    El uso de la API desde Workbench no está asociado con una clave de API, por lo que api_key_id será null incluso cuando se agrupe por esa dimensión.

    ¿Cómo se representa el espacio de trabajo predeterminado?

    El uso y los costos atribuidos al espacio de trabajo predeterminado tienen un valor null para workspace_id.

    ¿Cómo obtengo desgloses de costo por usuario para Claude Code?

    Usa la API de Análisis de Claude Code, que proporciona costos estimados por usuario y métricas de productividad sin las limitaciones de rendimiento de desglosar costos por muchas claves de API. Para uso general de la API con muchas claves, usa la API de Uso para rastrear el consumo de tokens como un proxy de costo.

    Ver también

    Las APIs de Uso y Costo se pueden usar para ayudarte a ofrecer una mejor experiencia a tus usuarios, ayudarte a gestionar costos y preservar tu límite de velocidad. Obtén más información sobre algunas de estas otras características:

    • Descripción general de la API de Administración
    • Referencia de la API de Administración
    • Precios
    • Almacenamiento en caché de prompts - Optimiza costos con almacenamiento en caché
    • Procesamiento por lotes - 50% de descuento en solicitudes por lotes
    • Límites de velocidad - Comprende los niveles de uso
    • Residencia de datos - Controla la geografía de inferencia

    Was this page helpful?

    • Soluciones de socios
    • Inicio rápido
    • API de Uso
    • Conceptos clave
    • Ejemplos básicos
    • Límites de granularidad de tiempo
    • API de Costo
    • Conceptos clave
    • Ejemplo básico
    • Paginación
    • Casos de uso comunes
    • Preguntas frecuentes
    • ¿Qué tan frescos son los datos?
    • ¿Cuál es la frecuencia de sondeo recomendada?
    • ¿Cómo rastro el uso de ejecución de código?
    • ¿Cómo rastro el uso del Nivel de Prioridad?
    • ¿Qué sucede con el uso de Workbench?
    • ¿Cómo se representa el espacio de trabajo predeterminado?
    • ¿Cómo obtengo desgloses de costo por usuario para Claude Code?
    • Ver también