Para notas de lançamento sobre os Claude Apps, consulte as Notas de lançamento dos Claude Apps na Central de Ajuda do Claude.
Para atualizações do Claude Code, consulte o CHANGELOG.md completo no repositório claude-code.
- Lançamos o Claude Fable 5 (
claude-fable-5), nosso modelo mais capaz amplamente disponibilizado, juntamente com o Claude Mythos 5 (claude-mythos-5) para participantes do Project Glasswing. Ambos os modelos suportam uma janela de contexto de 1M de tokens por padrão, 128k tokens máximos de saída e pensamento adaptativo sempre ativo. Consulte Apresentando Claude Fable 5 e Claude Mythos 5 para capacidades, mudanças na API e disponibilidade.
- Claude Fable 5 e Claude Mythos 5 usam o tokenizador introduzido com o Claude Opus 4.7. Em comparação com modelos anteriores ao Claude Opus 4.7, o mesmo texto produz aproximadamente 30% mais tokens. Use a API de contagem de tokens com
model: "claude-fable-5" para medir seus prompts com o novo tokenizador.
- O Claude Fable 5 executa classificadores de segurança nas requisições e durante a geração de respostas. Quando um classificador recusa uma requisição, a Messages API retorna
stop_reason: "refusal". Você não é cobrado por uma requisição recusada antes de qualquer saída ser gerada. Um parâmetro opcional fallbacks (em beta na API do Claude e na Claude Platform on AWS; não suportado na Message Batches API) reexecuta requisições recusadas em outro modelo, cobrado às taxas do modelo de fallback. Consulte Tratamento de motivos de parada.
- O campo
stop_details.category em respostas de recusa agora inclui "reasoning_extraction" no Claude Fable 5, retornado quando uma requisição é bloqueada sob as restrições dos Termos de Serviço da Anthropic sobre engenharia reversa ou duplicação de saídas do modelo. As categorias existentes "cyber" e "bio" permanecem inalteradas. Nenhum cabeçalho beta é necessário.
- No Claude Fable 5 e Claude Mythos 5, o pensamento adaptativo é o único modo de pensamento:
thinking: {"type": "disabled"} não é suportado, e orçamentos manuais de pensamento estendido e preenchimento prévio do assistente não são suportados (ambos retornam um erro 400). Consulte Migrando do Claude Mythos Preview para o Claude Mythos 5.
- No Claude Fable 5 e Claude Mythos 5,
thinking.display tem como padrão "omitted", o mesmo que Claude Opus 4.8, Claude Opus 4.7 e Claude Mythos Preview; defina display: "summarized" para receber resumos legíveis do pensamento. A cadeia de raciocínio bruta nunca é retornada; passe os blocos de pensamento de volta sem alterações em conversas de múltiplos turnos no mesmo modelo. Consulte Saída de pensamento no Claude Fable 5 e Claude Mythos 5.
- O Claude Fable 5 requer retenção de dados de 30 dias na API do Claude e não está disponível sob retenção zero de dados. Consulte Requisitos de retenção de dados específicos por modelo.
- O Claude Managed Agents agora suporta implantações agendadas, permitindo que você execute sessões em um agendamento cron sem gerenciar seu próprio agendador.
- Os vaults do Claude Managed Agents agora suportam credenciais de variáveis de ambiente, para que você possa injetar segredos com segurança no sandbox do agente para CLIs, SDKs e outros serviços que se autenticam por meio de variáveis de ambiente.
- Os eventos de webhook
session.thread_* agora incluem um campo session_thread_id identificando a thread multiagente que acionou o evento.
- Anunciamos a descontinuação do modelo Claude Opus 4.1 (
claude-opus-4-1-20250805), com retirada na API do Claude agendada para 5 de agosto de 2026. Recomendamos migrar para o Claude Opus 4.8. Leia mais em descontinuações de modelos.
- A ferramenta advisor agora suporta um parâmetro
max_tokens para limitar a saída do modelo advisor por chamada, reduzindo a latência e o custo de tokens de saída para cargas de trabalho que não precisam de respostas completas do advisor. Defina tools[].max_tokens na definição da ferramenta advisor; consulte Limitando a saída do advisor.
- Na API do Claude, você não é mais cobrado por uma requisição quando ela retorna
stop_reason: "refusal" sem que o Claude tenha gerado qualquer saída. Consulte Recusas em streaming para detectar e tratar recusas.
- Lançamos o Claude Opus 4.8 (claude-opus-4-8), nosso modelo mais capaz em disponibilidade geral. O Claude Opus 4.8 suporta uma janela de contexto de 1M de tokens por padrão na API do Claude, Amazon Bedrock e Vertex AI (200k no Microsoft Foundry), 128k tokens máximos de saída e o mesmo conjunto de ferramentas e recursos de plataforma que o Claude Opus 4.7. Consulte Novidades no Claude Opus 4.8 para melhorias de capacidade, novos recursos e orientações de migração.
- Lançamos mensagens de sistema no meio da conversa. No Claude Opus 4.8, você pode enviar mensagens
role: "system" após um turno do usuário (sujeito a regras de posicionamento) no array messages, preservando acertos de cache de prompt quando as instruções mudam durante uma sessão de longa duração. Nenhum cabeçalho beta é necessário.
- O campo
stop_details em respostas de recusa agora está documentado publicamente; ele retorna uma category (cyber, bio ou null) e uma explanation legível por humanos, para que sua aplicação possa encaminhar diferentes classes de recusa para o próximo passo correto. Nenhum cabeçalho beta é necessário.
- A resposta da Messages API agora inclui
usage.output_tokens_details.thinking_tokens, informando quantos dos tokens de saída cobrados foram de pensamento estendido. Ao usar streaming, a discriminação aparece apenas no evento final message_delta. Nenhum cabeçalho beta é necessário.
- Túneis MCP agora está disponível como prévia de pesquisa, para que você possa se conectar a servidores MCP em sua rede privada.
- Sandboxes auto-hospedados agora estão disponíveis para o Claude Managed Agents, como alternativa à execução de ferramentas na infraestrutura da Anthropic. Consulte Sandboxes auto-hospedados.
- Com o Claude Managed Agents, agora você pode atualizar as configurações de servidor MCP e ferramentas do agente associadas a uma sessão ativa.
- Com o Claude Managed Agents, saídas grandes de ferramentas
agent_toolset e MCP que excedem 100K tokens agora são automaticamente transferidas para um arquivo no sandbox. O modelo recebe uma prévia truncada com o caminho do arquivo e pode ler o conteúdo completo a partir dele.
- A ferramenta de busca na web agora retorna dados mais ricos de registros da SEC, facilitando fundamentar agentes de pesquisa financeira, análise de resultados e fluxos de trabalho de due diligence em fontes primárias com citações.
- Lançamos diagnósticos de cache em beta público. Passe
diagnostics.previous_message_id em uma requisição Messages e a API reporta um cache_miss_reason explicando onde o prefixo do cache de prompt divergiu do turno anterior. Inclua o cabeçalho beta cache-diagnosis-2026-04-07 em suas requisições.
- O modo rápido (prévia de pesquisa) agora suporta o Claude Opus 4.7. Defina
speed: "fast" com model: "claude-opus-4-7" e o cabeçalho beta fast-mode-2026-02-01 para geração de tokens de saída significativamente mais rápida com preço premium. Preços, limites de taxa e acesso são os mesmos do modo rápido do Opus 4.6; clientes interessados devem entrar na lista de espera.
- Lançamos a Claude Platform on AWS, trazendo a API do Claude para infraestrutura gerenciada pela Anthropic acessível através da AWS, com faturamento AWS e autenticação IAM. Acesse a Messages API completa, Files API, Message Batches API, Claude Managed Agents, Agent Skills, execução de código e uso de ferramentas através de endpoints nativos da AWS. Saiba mais em Claude Platform on AWS.
- Sessões multiagente e Outcomes agora estão em beta público sob o cabeçalho beta padrão
managed-agents-2026-04-01.
- A atualização em segundo plano de credenciais de vault do Claude Managed Agents agora é suportada para credenciais
mcp_oauth. Consulte Autenticar com vaults.
- Webhooks para o Claude Managed Agents agora são suportados. Os tipos de eventos de webhook incluem eventos de ciclo de vida de sessão e vault. Consulte Assinar webhooks.
- Opções adicionais de filtragem e ordenação agora são suportadas para o Claude Managed Agents. Sessões podem ser filtradas por status, e eventos podem ser filtrados por tipo. Eventos agora podem ser filtrados por hora de criação.
- Retiramos o beta da janela de contexto de 1M de tokens (
context-1m-2025-08-07) para Claude Sonnet 4.5 e Claude Sonnet 4. O cabeçalho beta agora não tem efeito nesses modelos, e requisições que excedem a janela de contexto padrão de 200k tokens retornam um erro. Para usar a janela de contexto de 1M, migre para o Claude Sonnet 4.6 ou Claude Opus 4.6, onde ela está em disponibilidade geral com preço padrão sem necessidade de cabeçalho beta.
- Lançamos a Rate Limits API, permitindo que administradores consultem programaticamente os limites de taxa configurados para sua organização e workspaces.
- A memória para o Claude Managed Agents agora está em beta público sob o cabeçalho padrão
managed-agents-2026-04-01. Consulte Usando memória do agente para o guia completo de integração.
- Retiramos o modelo Claude Haiku 3 (
claude-3-haiku-20240307). Todas as requisições a este modelo agora retornarão um erro. Recomendamos atualizar para o Claude Haiku 4.5.
- Lançamos o Claude Opus 4.7, nosso modelo mais capaz em disponibilidade geral para raciocínio complexo e codificação agêntica, com o mesmo preço de $5 / $25 por MTok do Opus 4.6. Consulte Novidades no Claude Opus 4.7 para melhorias de capacidade, novos recursos e o tokenizador atualizado. O Opus 4.7 inclui mudanças incompatíveis na API em relação ao Opus 4.6; consulte Migrando para o Claude Opus 4.7 antes de atualizar.
- O Claude no Amazon Bedrock agora está aberto a todos os clientes do Amazon Bedrock. Claude Opus 4.7 e Claude Haiku 4.5 estão disponíveis em autoatendimento no console do Bedrock através do endpoint da Messages API em
/anthropic/v1/messages, em 27 regiões da AWS com endpoints globais e regionais.
- Anunciamos a descontinuação do modelo Claude Sonnet 4 (
claude-sonnet-4-20250514) e do modelo Claude Opus 4 (claude-opus-4-20250514), com retirada na API do Claude agendada para 15 de junho de 2026. Recomendamos migrar para o Claude Sonnet 4.6 e Claude Opus 4.8 respectivamente. Leia mais em descontinuações de modelos.
- Lançamos a ferramenta advisor em beta público. Combine um modelo executor mais rápido com um modelo advisor de maior inteligência que fornece orientação estratégica durante a geração, para que cargas de trabalho agênticas de longo horizonte obtenham qualidade próxima à do advisor sozinho enquanto a maior parte da geração de tokens acontece às taxas do modelo executor. Inclua o cabeçalho beta
advisor-tool-2026-03-01 em suas requisições.
- Lançamos o Claude Managed Agents em beta público, um harness de agente totalmente gerenciado para executar o Claude como um agente autônomo com sandboxing seguro, ferramentas integradas e streaming de eventos enviados pelo servidor. Crie agentes, configure contêineres e execute sessões através da API. Todos os endpoints requerem o cabeçalho beta
managed-agents-2026-04-01. Saiba mais em Visão geral do Claude Managed Agents.
- Lançamos a CLI
ant, um cliente de linha de comando para a API do Claude que permite interação mais rápida com a API do Claude, integração nativa com o Claude Code e versionamento de recursos da API em arquivos YAML. Saiba mais no início rápido da CLI.
- Anunciamos que o Claude Mythos Preview está disponível como prévia de pesquisa restrita para trabalho de cibersegurança defensiva como parte do Project Glasswing. O acesso é apenas por convite.
- A Messages API agora está disponível no Amazon Bedrock como prévia de pesquisa. O novo endpoint do Claude no Amazon Bedrock em
/anthropic/v1/messages usa o mesmo formato de requisição da API do Claude de primeira parte e é executado em infraestrutura gerenciada pela AWS com zero acesso de operador. Disponível em us-east-1; entre em contato com seu executivo de contas da Anthropic para solicitar acesso. Saiba mais em Claude no Amazon Bedrock.
- Aumentamos o limite de
max_tokens para 300k na Message Batches API para Claude Opus 4.6 e Sonnet 4.6. Inclua o cabeçalho beta output-300k-2026-03-24 para gerar saídas mais longas de turno único para conteúdo de formato longo, dados estruturados e tarefas de geração de código grandes.
- Estamos retirando o beta da janela de contexto de 1M de tokens para Claude Sonnet 4.5 e Claude Sonnet 4 em 30 de abril de 2026. Após essa data, o cabeçalho beta
context-1m-2025-08-07 não terá efeito nesses modelos, e requisições que excedam a janela de contexto padrão de 200k tokens retornarão um erro. Para continuar usando janelas de contexto de 1M, migre para o Claude Sonnet 4.6 ou Claude Opus 4.6, que suportam a janela de contexto completa de 1M de tokens com preço padrão sem necessidade de cabeçalho beta.
- Adicionamos campos de capacidade de modelo à Models API.
GET /v1/models e GET /v1/models/{model_id} agora retornam max_input_tokens, max_tokens e um objeto capabilities. Consulte a API para descobrir o que cada modelo suporta.
- Lançamos o campo
display para pensamento estendido, permitindo que você omita o conteúdo de pensamento das respostas para streaming mais rápido. Defina thinking.display: "omitted" para receber blocos de pensamento com um campo thinking vazio e a signature preservada para continuidade em múltiplos turnos. A cobrança permanece inalterada. Saiba mais em Controlando a exibição do pensamento.
- A janela de contexto de 1M de tokens agora está em disponibilidade geral para Claude Opus 4.6 e Sonnet 4.6 com preço padrão. Requisições acima de 200k tokens funcionam automaticamente para esses modelos sem necessidade de cabeçalho beta. A janela de contexto de 1M de tokens permanece em beta para Claude Sonnet 4.5 e Sonnet 4.
- Removemos os limites de taxa dedicados de 1M para todos os modelos suportados. Seus limites padrão de conta agora se aplicam a todos os comprimentos de contexto.
- Aumentamos o limite de mídia de 100 para 600 imagens ou páginas de PDF por requisição ao usar a janela de contexto de 1M de tokens.
- Lançamos o cache automático para a Messages API. Adicione um único campo
cache_control ao corpo da sua requisição e o sistema automaticamente armazena em cache o último bloco cacheável, movendo o ponto de cache para frente conforme as conversas crescem. Nenhum gerenciamento manual de pontos de interrupção é necessário. Funciona junto com o controle de cache existente em nível de bloco para otimização refinada. Disponível na API do Claude e no Microsoft Foundry (prévia). Saiba mais em Cache de prompt.
- Retiramos o modelo Claude Sonnet 3.7 (
claude-3-7-sonnet-20250219) e o modelo Claude Haiku 3.5 (claude-3-5-haiku-20241022). Todas as requisições a esses modelos agora retornarão um erro. Recomendamos atualizar para o Claude Sonnet 4.6 e Claude Haiku 4.5 respectivamente. Pesquisadores podem solicitar acesso contínuo através do Programa de Acesso para Pesquisadores Externos.
- Anunciamos a descontinuação do modelo Claude Haiku 3 (
claude-3-haiku-20240307), com retirada agendada para 20 de abril de 2026. Recomendamos migrar para o Claude Haiku 4.5. Leia mais em Descontinuações de modelos.
- Lançamos o modo rápido em prévia de pesquisa para o Opus 4.6, fornecendo geração de tokens de saída significativamente mais rápida através do parâmetro
speed. O modo rápido é até 2,5x mais rápido com preço premium. Clientes interessados devem entrar na lista de espera.
- Lançamos o Claude Opus 4.6, nosso modelo mais inteligente para tarefas agênticas complexas e trabalho de longo horizonte. O Opus 4.6 recomenda pensamento adaptativo (
thinking: {type: "adaptive"}); o pensamento manual (type: "enabled" com budget_tokens) está descontinuado. O Opus 4.6 não suporta preenchimento prévio de mensagens do assistente. Saiba mais em Novidades no Claude 4.6.
- O parâmetro effort agora está em disponibilidade geral (nenhum cabeçalho beta necessário) e suporta o Claude Opus 4.6. O effort substitui
budget_tokens para controlar a profundidade do pensamento em novos modelos.
- Lançamos a API de compactação em beta, fornecendo sumarização de contexto do lado do servidor para conversas efetivamente infinitas. Disponível no Opus 4.6.
- Introduzimos controles de residência de dados, permitindo que você especifique onde a inferência do modelo é executada com o parâmetro
inference_geo. Inferência apenas nos EUA está disponível a 1,1x do preço para modelos lançados após 1º de fevereiro de 2026.
- A agora está disponível em beta para o Claude Opus 4.6, além do Sonnet 4.5 e Sonnet 4. se aplicam a requisições que excedem 200k tokens de entrada.
- Saídas estruturadas agora estão em disponibilidade geral na API do Claude para Claude Sonnet 4.5, Claude Opus 4.5 e Claude Haiku 4.5. A disponibilidade geral inclui suporte expandido a schemas, latência aprimorada de compilação de gramática e um caminho de integração simplificado sem necessidade de cabeçalho beta. O parâmetro
output_format foi movido para output_config.format. Usuários beta existentes podem continuar usando o cabeçalho beta durante o período de transição. Saídas estruturadas permanecem em beta público no Amazon Bedrock e Microsoft Foundry.
console.anthropic.com agora redireciona para platform.claude.com. O Claude Console mudou para seu novo endereço como parte da nossa consolidação da marca Claude. Favoritos e links existentes continuarão funcionando via redirecionamento automático. Para mais detalhes, consulte o anúncio de 16 de setembro de 2025.
- Retiramos o modelo Claude Opus 3 (
claude-3-opus-20240229). Todas as requisições a este modelo agora retornarão um erro. Recomendamos atualizar para o Claude Opus 4.5, que oferece inteligência significativamente aprimorada a um terço do custo. Pesquisadores podem solicitar acesso contínuo ao Claude Opus 3 na API através do Programa de Acesso para Pesquisadores Externos.
- Lançamos o Claude Opus 4.5, nosso modelo mais inteligente combinando capacidade máxima com desempenho prático. Ideal para tarefas especializadas complexas, engenharia de software profissional e agentes avançados. Apresenta melhorias significativas em visão, codificação e uso de computador a um preço mais acessível do que modelos Opus anteriores. Saiba mais em Visão geral dos modelos.
- Lançamos a chamada programática de ferramentas em beta público, permitindo que o Claude chame ferramentas de dentro da execução de código para reduzir latência e uso de tokens em fluxos de trabalho com múltiplas ferramentas.
- Lançamos a ferramenta de busca de ferramentas em beta público, permitindo que o Claude descubra e carregue ferramentas dinamicamente sob demanda a partir de grandes catálogos de ferramentas.
- Lançamos o parâmetro effort em beta público para o Claude Opus 4.5, permitindo que você controle o uso de tokens equilibrando entre completude da resposta e eficiência.
- Adicionamos compactação do lado do cliente aos nossos SDKs Python e TypeScript, gerenciando automaticamente o contexto da conversa através de sumarização ao usar
tool_runner.
- Blocos de conteúdo de resultados de busca agora estão em disponibilidade geral no Amazon Bedrock. Saiba mais em Resultados de busca.
- Lançamos uma nova plataforma de documentação em platform.claude.com/docs. Nossa documentação agora fica lado a lado com o Claude Console, proporcionando uma experiência unificada para desenvolvedores. O site de documentação anterior em docs.claude.com redirecionará para o novo local.
- Lançamos o Claude no Microsoft Foundry, trazendo modelos Claude para clientes do Azure com faturamento Azure e autenticação OAuth. Acesse a Messages API completa, incluindo pensamento estendido, cache de prompt (5 minutos e 1 hora), suporte a PDF, Files API, Agent Skills e uso de ferramentas. Saiba mais em Claude no Microsoft Foundry.
- Lançamos saídas estruturadas em beta público, fornecendo conformidade garantida com schema para as respostas do Claude. Use saídas JSON para respostas de dados estruturados ou uso estrito de ferramentas para entradas de ferramentas validadas. Disponível para Claude Sonnet 4.5 e Claude Opus 4.1. Para habilitar, use o cabeçalho beta
structured-outputs-2025-11-13.
- Anunciamos a descontinuação do modelo Claude Sonnet 3.7. Leia mais em Descontinuações de modelos.
- Retiramos os modelos Claude Sonnet 3.5. Todas as requisições a esses modelos agora retornarão um erro.
- Expandimos a edição de contexto com limpeza de blocos de pensamento (
clear_thinking_20251015), permitindo o gerenciamento automático de blocos de pensamento. Saiba mais em Edição de contexto.
- Lançamos Agent Skills (beta
skills-2025-10-02), uma nova forma de estender as capacidades do Claude. Skills são pastas organizadas de instruções, scripts e recursos que o Claude carrega dinamicamente para executar tarefas especializadas. O lançamento inicial inclui:
- Skills gerenciadas pela Anthropic: Skills pré-construídas para trabalhar com arquivos PowerPoint (.pptx), Excel (.xlsx), Word (.docx) e PDF
- Skills personalizadas: Faça upload de suas próprias Skills via Skills API (endpoints
/v1/skills) para empacotar expertise de domínio e fluxos de trabalho organizacionais
- Skills requerem que a ferramenta de execução de código esteja habilitada
- Saiba mais em Agent Skills e referência da API
- Lançamos o Claude Haiku 4.5, nosso modelo Haiku mais rápido e inteligente com desempenho próximo ao de fronteira. Ideal para aplicações em tempo real, processamento de alto volume e implantações sensíveis a custo que requerem raciocínio forte. Saiba mais em Visão geral dos modelos.
- Lançamos o Claude Sonnet 4.5, nosso melhor modelo para agentes complexos e codificação, com a maior inteligência na maioria das tarefas. Saiba mais na visão geral dos modelos.
- Introduzimos preços de endpoint global para Amazon Bedrock e Vertex AI. Os preços da API do Claude (1P) não são afetados.
- Introduzimos um novo motivo de parada
model_context_window_exceeded que permite solicitar o máximo de tokens possível sem calcular o tamanho da entrada. Saiba mais em Tratamento de motivos de parada.
- Lançamos a ferramenta de memória em beta, permitindo que o Claude armazene e consulte informações entre conversas. Saiba mais em Ferramenta de memória.
- Lançamos a edição de contexto em beta, fornecendo estratégias para gerenciar automaticamente o contexto da conversa. O lançamento inicial suporta a limpeza de resultados e chamadas de ferramentas mais antigos ao se aproximar dos limites de tokens. Saiba mais em Edição de contexto.
- Lançamos auxiliares de ferramentas em beta para os SDKs Python e TypeScript, simplificando a criação e execução de ferramentas com validação de entrada com segurança de tipos e um executor de ferramentas para tratamento automatizado de ferramentas em conversas. Para detalhes, consulte a documentação do SDK Python e do SDK TypeScript.
- Unificamos nossas ofertas para desenvolvedores sob a marca Claude. Você verá nomes e URLs atualizados em nossa plataforma e documentação, mas nossas interfaces para desenvolvedores permanecerão as mesmas. Aqui estão algumas mudanças notáveis:
- Lançamos a ferramenta de busca na web em beta, permitindo que o Claude recupere conteúdo completo de páginas da web e documentos PDF especificados. Saiba mais em Ferramenta de busca na web.
- Lançamos a Claude Code Analytics API, permitindo que organizações acessem programaticamente métricas de uso agregadas diárias do Claude Code, incluindo métricas de produtividade, estatísticas de uso de ferramentas e dados de custo.
- Lançamos gráficos de limite de taxa na página de Uso do Console, permitindo que você monitore o uso do limite de taxa da API e as taxas de cache ao longo do tempo.
- Lançamos a v2 da Ferramenta de Execução de Código em beta público, substituindo a ferramenta original apenas para Python por execução de comandos Bash e recursos de manipulação direta de arquivos, incluindo escrita de código em outras linguagens.
- IDs de requisição agora são incluídos diretamente nos corpos de resposta de erro, além do cabeçalho
request-id existente. Saiba mais em Erros.
- Anunciamos a descontinuação dos modelos Claude Sonnet 3.5 (
claude-3-5-sonnet-20240620 e claude-3-5-sonnet-20241022). Esses modelos serão retirados em 28 de outubro de 2025. Recomendamos migrar para o Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) para obter desempenho e recursos aprimorados. Leia mais em Descontinuações de modelos.
- A duração de cache de 1 hora para cache de prompt agora está disponível de forma geral. Agora você pode usar o TTL de cache estendido sem um cabeçalho beta. Saiba mais em Cache de prompt.
- Alguns clientes podem encontrar erros 429 (
rate_limit_error) após um aumento acentuado no uso da API devido a limites de aceleração na API. Anteriormente, erros 529 (overloaded_error) ocorriam em cenários semelhantes.
- Blocos de conteúdo de resultados de busca agora estão disponíveis de forma geral na API do Claude e no Vertex AI. Esse recurso permite citações naturais para aplicações RAG com atribuição adequada de fonte. O cabeçalho beta
search-results-2025-06-09 não é mais necessário. Saiba mais em Resultados de busca.
* - O Opus 4.1 não permite que os parâmetros temperature e top_p sejam especificados juntos. Use apenas um deles.
- Lançamos o
text_editor_20250728, uma ferramenta de editor de texto atualizada que corrige alguns problemas das versões anteriores e adiciona um parâmetro opcional max_characters que permite controlar o comprimento de truncamento ao visualizar arquivos grandes.
- Aumentamos os limites de taxa para o Claude Opus 4 na API do Claude para oferecer mais capacidade para construir e escalar com o Claude. Para clientes com limites de taxa de nível de uso 1-4, essas alterações se aplicam imediatamente à sua conta — nenhuma ação é necessária.
- Retiramos os modelos Claude 2.0, Claude 2.1 e Claude Sonnet 3. Todas as requisições a esses modelos agora retornarão um erro. Leia mais em Descontinuações de modelos.
- Aumentamos os limites de taxa para o Claude Sonnet 4 na API do Claude para oferecer mais capacidade para construir e escalar com o Claude. Para clientes com limites de taxa de nível de uso 1-4, essas alterações se aplicam imediatamente à sua conta — nenhuma ação é necessária.
- Lançamos blocos de conteúdo de resultados de busca em beta, permitindo citações naturais para aplicações RAG. Ferramentas agora podem retornar resultados de busca com atribuição adequada de fonte, e o Claude citará automaticamente essas fontes em suas respostas — igualando a qualidade de citação da busca na web. Isso elimina a necessidade de soluções alternativas com documentos em aplicações de base de conhecimento personalizadas. Saiba mais em Resultados de busca. Para habilitar esse recurso, use o cabeçalho beta
search-results-2025-06-09.
- Usuários do Console com a função de Desenvolvedor agora podem acessar a página de Custo. Anteriormente, a função de Desenvolvedor permitia acesso à página de Uso, mas não à página de Custo.
- Lançamos o streaming refinado de uso de ferramentas em beta público, um recurso que permite ao Claude fazer streaming de parâmetros de uso de ferramentas sem buffering / validação de JSON. Para habilitar o streaming refinado de uso de ferramentas, use o cabeçalho beta
fine-grained-tool-streaming-2025-05-14.
- Lançamos o Claude Opus 4 e o Claude Sonnet 4, nossos modelos mais recentes com recursos de pensamento estendido. Saiba mais em Visão geral dos modelos.
- O comportamento padrão do pensamento estendido nos modelos Claude 4 retorna um resumo do processo completo de pensamento do Claude, com o pensamento completo criptografado e retornado no campo
signature da saída do bloco thinking.
- Lançamos o pensamento intercalado em beta público, um recurso que permite ao Claude pensar entre chamadas de ferramentas. Para habilitar o pensamento intercalado, use o cabeçalho beta
interleaved-thinking-2025-05-14.
- Lançamos a Files API em beta público, permitindo que você faça upload de arquivos e os referencie na Messages API e na ferramenta de execução de código.
- Lançamos a Ferramenta de execução de código em beta público, uma ferramenta que permite ao Claude executar código Python em um ambiente seguro e isolado.
- Lançamos o em beta público, um recurso que permite conectar-se a servidores MCP remotos diretamente da Messages API.
- Lançamos uma ferramenta de busca na web na API, permitindo que o Claude acesse informações atualizadas da web. Saiba mais em Ferramenta de busca na web.
- O controle de cache agora deve ser especificado diretamente no bloco
content pai de tool_result e document.source. Para compatibilidade com versões anteriores, se o controle de cache for detectado no último bloco em tool_result.content ou document.source.content, ele será aplicado automaticamente ao bloco pai. O controle de cache em quaisquer outros blocos dentro de tool_result.content e document.source.content resultará em um erro de validação.
- Adicionamos blocos de origem de URL para imagens e PDFs na Messages API. Agora você pode referenciar imagens e PDFs diretamente via URL em vez de ter que codificá-los em base64. Saiba mais em Visão e Suporte a PDF.
- Adicionamos suporte para uma opção
none ao parâmetro tool_choice na Messages API que impede o Claude de chamar qualquer ferramenta. Além disso, não é mais necessário fornecer tools ao incluir blocos tool_use e tool_result.
- Lançamos um endpoint de API compatível com OpenAI, permitindo que você teste modelos Claude alterando apenas sua chave de API, URL base e nome do modelo em integrações OpenAI existentes. Essa camada de compatibilidade oferece suporte à funcionalidade principal de chat completions. Saiba mais em Compatibilidade com o SDK da OpenAI.
- Lançamos o Claude Sonnet 3.7, nosso modelo mais inteligente até agora. O Claude Sonnet 3.7 pode produzir respostas quase instantâneas ou mostrar seu pensamento estendido passo a passo. Um modelo, duas formas de pensar. Saiba mais sobre todos os modelos Claude em Visão geral dos modelos.
- Adicionamos suporte a visão ao Claude Haiku 3.5, permitindo que o modelo analise e compreenda imagens.
- Lançamos uma implementação de uso de ferramentas eficiente em tokens, melhorando o desempenho geral ao usar ferramentas com o Claude. Saiba mais em Uso de ferramentas com o Claude.
- Alteramos a temperatura padrão no Console para novos prompts de 0 para 1, para consistência com a temperatura padrão na API. Prompts salvos existentes permanecem inalterados.
- Lançamos versões atualizadas de nossas ferramentas que desacoplam as ferramentas de edição de texto e bash do prompt do sistema de uso de computador:
bash_20250124: Mesma funcionalidade da versão anterior, mas é independente do uso de computador. Não requer um cabeçalho beta.
text_editor_20250124: Mesma funcionalidade da versão anterior, mas é independente do uso de computador. Não requer um cabeçalho beta.
- Adicionamos o cabeçalho de resposta
anthropic-organization-id a todas as respostas da API. Esse cabeçalho fornece o ID da organização associado à chave de API usada na requisição.
- Lançamos o recurso de citações na API, permitindo que o Claude forneça atribuição de fonte para informações. Saiba mais em Citações.
- Adicionamos suporte para documentos de texto simples e documentos de conteúdo personalizado na Messages API.
- Atualizamos o cache de prompt para ser mais fácil de usar. Agora, quando você define um ponto de interrupção de cache, leremos automaticamente do seu prefixo mais longo previamente armazenado em cache.
- Agora você pode colocar palavras na boca do Claude ao usar ferramentas.
Os seguintes recursos agora estão disponíveis de forma geral na API do Claude:
- Models API: Consulte modelos disponíveis, valide IDs de modelos e resolva aliases de modelos para seus IDs de modelo canônicos.
- Message Batches API: Processe grandes lotes de mensagens de forma assíncrona por 50% do custo padrão da API.
- Token counting API: Calcule contagens de tokens para Mensagens antes de enviá-las ao Claude.
- Cache de prompt: Reduza custos em até 90% e latência em até 80% armazenando em cache e reutilizando conteúdo de prompt.
- Suporte a PDF: Processe PDFs para analisar conteúdo de texto e visual dentro de documentos.
Também lançamos novos SDKs oficiais:
- Lançamos a Admin API, permitindo que usuários gerenciem programaticamente os recursos de sua organização.
- Atualizamos nossos limites de taxa para a Messages API. Substituímos o limite de taxa de tokens por minuto por novos limites de taxa de tokens de entrada e saída por minuto. Leia mais em Limites de taxa.
- Adicionamos suporte para uso de ferramentas no Workbench.
- Adicionamos suporte a PDF para todos os modelos Claude Sonnet 3.5. Leia mais em Suporte a PDF.
- O Claude Haiku 3.5 agora está disponível na API do Claude como um modelo somente de texto.
- Adicionamos suporte a PDF para uso com o novo Claude Sonnet 3.5. Leia mais em Suporte a PDF.
- Também adicionamos contagem de tokens, que permite determinar o número total de tokens em uma Mensagem antes de enviá-la ao Claude. Leia mais em Contagem de tokens.
- Adicionamos ferramentas de uso de computador definidas pela Anthropic à nossa API para uso com o novo Claude Sonnet 3.5. Leia mais em Ferramenta de uso de computador.
- O Claude Sonnet 3.5, nosso modelo mais inteligente até agora, acabou de receber uma atualização e agora está disponível na API do Claude. Leia mais na documentação do Claude Sonnet.
- A Message Batches API agora está disponível em beta. Processe grandes lotes de consultas de forma assíncrona na API do Claude por 50% menos custo. Leia mais em Processamento em lote.
- Flexibilizamos as restrições na ordenação de turnos
user/assistant em nossa Messages API. Mensagens user/assistant consecutivas serão combinadas em uma única mensagem em vez de gerar erro, e não exigimos mais que a primeira mensagem de entrada seja uma mensagem user.
- Descontinuamos os planos Build e Scale em favor de um conjunto de recursos padrão (anteriormente chamado de Build), juntamente com recursos adicionais que estão disponíveis através de vendas. Leia mais em nossas informações de preços da API.
- Adicionamos a capacidade de desabilitar o uso paralelo de ferramentas na API. Defina
disable_parallel_tool_use: true no campo tool_choice para garantir que o Claude use no máximo uma ferramenta. Leia mais em Uso paralelo de ferramentas.
- Adicionamos Workspaces ao Developer Console. Workspaces permitem que você defina limites personalizados de gastos ou de taxa, agrupe chaves de API, acompanhe o uso por projeto e controle o acesso com funções de usuário. Leia mais em nosso post no blog.
- Adicionamos suporte para uso do SDK em navegadores retornando cabeçalhos CORS nas respostas da API. Defina
dangerouslyAllowBrowser: true na instanciação do SDK para habilitar esse recurso.
- Movemos saídas de 8.192 tokens de beta para disponibilidade geral para o Claude Sonnet 3.5.
- O cache de prompt agora está disponível como um recurso beta na API do Claude. Armazene em cache e reutilize prompts para reduzir a latência em até 80% e os custos em até 90%.
- Gere saídas de até 8.192 tokens de comprimento do Claude Sonnet 3.5 com o novo cabeçalho
anthropic-beta: max-tokens-3-5-sonnet-2024-07-15.
- Gere automaticamente casos de teste para seus prompts usando o Claude no Developer Console.
- Compare as saídas de diferentes prompts lado a lado no novo modo de comparação de saída no Developer Console.
- O Claude Sonnet 3.5, nosso modelo mais inteligente até agora, agora está disponível de forma geral na API do Claude, Amazon Bedrock e Vertex AI.
- O uso de ferramentas agora está disponível de forma geral na API do Claude, Amazon Bedrock e Vertex AI.
- Nossa ferramenta geradora de prompts agora está disponível no Developer Console. O Gerador de Prompts facilita orientar o Claude a gerar prompts de alta qualidade adaptados às suas tarefas específicas. Leia mais em nosso post no blog.