Esta é a referência única para engenharia de prompts com os modelos mais recentes do Claude, incluindo Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. Ela cobre técnicas fundamentais, controle de saída, uso de ferramentas, pensamento e sistemas agênticos. Vá para a seção que corresponde à sua situação.
Para uma visão geral das capacidades do modelo, consulte a visão geral dos modelos. Para detalhes sobre o que há de novo no Claude Opus 4.7, consulte O que há de novo no Claude Opus 4.7. Para orientação de migração, consulte o Guia de migração.
Claude Opus 4.7 é nosso modelo mais capaz disponível em geral, com forças particulares em trabalho agêntico de longo horizonte, trabalho de conhecimento, visão e tarefas de memória. Ele funciona bem imediatamente em prompts existentes do Claude Opus 4.6. Os padrões abaixo cobrem os comportamentos que mais frequentemente requerem ajuste.
Para mudanças de parâmetros de API ao migrar do Claude Opus 4.6 (níveis de esforço, orçamentos de tarefas, configuração de pensamento, remoção de parâmetros de amostragem e tokenização), consulte o guia de migração.
Claude Opus 4.7 calibra o comprimento da resposta de acordo com a complexidade que julga a tarefa ter, em vez de usar uma verbosidade fixa padrão. Isso geralmente significa respostas mais curtas em buscas simples e muito mais longas em análises abertas.
Se seu produto depende de um certo estilo ou verbosidade de saída, você pode precisar ajustar seus prompts. Como exemplo, para diminuir a verbosidade, você pode adicionar:
Forneça respostas concisas e focadas. Pule contexto não essencial e mantenha exemplos mínimos.Se você vir exemplos específicos de tipos de verbosidade (ou seja, sobre-explicação), pode adicionar instruções adicionais em seu prompt para evitá-los. Exemplos positivos mostrando como Claude pode se comunicar com o nível apropriado de concisão tendem a ser mais eficazes do que exemplos negativos ou instruções que dizem ao modelo o que não fazer.
O parâmetro de esforço permite que você ajuste a inteligência do Claude versus gasto de tokens, negociando capacidade por velocidade mais rápida e custos mais baixos. Comece com o novo nível de esforço xhigh para codificação e casos de uso agênticos, e use um mínimo de esforço high para a maioria dos casos de uso sensíveis à inteligência. Experimente outros níveis de esforço para ajustar ainda mais o uso de tokens e inteligência:
max: O esforço máximo pode entregar ganhos de desempenho em alguns casos de uso, mas pode mostrar retornos decrescentes do aumento do uso de tokens. Esta configuração também pode às vezes ser propensa a excesso de pensamento. Recomendamos testar esforço máximo para tarefas que exigem inteligência.xhigh (novo): Esforço extra alto é a melhor configuração para a maioria dos casos de uso de codificação e agênticos.high: Esta configuração equilibra o uso de tokens e inteligência. Para a maioria dos casos de uso sensíveis à inteligência, recomendamos um mínimo de esforço high.medium: Bom para casos de uso sensíveis a custos que precisam reduzir o uso de tokens enquanto negociam inteligência.low: Reserve para tarefas curtas e escopo definido e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.Mudando significativamente do Claude Opus 4.6, Claude Opus 4.7 respeita os níveis de esforço estritamente, especialmente na extremidade inferior. Em low e medium, o modelo limita seu trabalho ao que foi solicitado em vez de ir além. Isso é bom para latência e custo, mas em tarefas moderadamente complexas executadas com esforço low há algum risco de sub-pensamento.
Se você observar raciocínio superficial em problemas complexos, aumente o esforço para high ou xhigh em vez de contornar com prompting. Se você precisar manter o esforço em low para latência, adicione orientação direcionada:
Esta tarefa envolve raciocínio em múltiplas etapas. Pense cuidadosamente sobre o problema antes de responder.Esperamos que o esforço seja mais importante para este modelo do que para qualquer Opus anterior, e recomendamos experimentar com ele ativamente quando você fizer upgrade.
O comportamento de acionamento para pensamento adaptativo é direcionável. Se você achar que o modelo está pensando mais frequentemente do que gostaria — o que pode acontecer com prompts de sistema grandes ou complexos — adicione orientação para direcioná-lo. Como sempre, meça o efeito de qualquer mudança de prompting no desempenho. Exemplo:
Pensar adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta — tipicamente para problemas que requerem raciocínio em múltiplas etapas. Em caso de dúvida, responda diretamente.Inversamente, se você estiver executando cargas de trabalho difíceis em medium e vendo sub-pensamento, a primeira alavanca é aumentar o esforço. Se você precisar de controle mais fino, peça por isso diretamente.
Se você estiver executando Claude Opus 4.7 com esforço max ou xhigh, defina um grande orçamento máximo de tokens de saída para que o modelo tenha espaço para pensar e agir em seus subagentes e chamadas de ferramentas. Recomendamos começar com 64k tokens e ajustar a partir daí.
Claude Opus 4.7 tem uma tendência de usar ferramentas com menos frequência do que Claude Opus 4.6 e usar raciocínio mais. Isso produz melhores resultados na maioria dos casos. No entanto, aumentar a configuração de esforço é uma alavanca útil para aumentar o nível de uso de ferramentas, especialmente em trabalho de conhecimento. As configurações de esforço high ou xhigh mostram substancialmente mais uso de ferramentas em busca agêntica e codificação. Para cenários onde você quer mais uso de ferramentas, você também pode ajustar seu prompt para instruir explicitamente o modelo sobre quando e como usar adequadamente suas ferramentas. Por exemplo, se você achar que o modelo não está usando suas ferramentas de busca na web, descreva claramente por que e como deveria.
Claude Opus 4.7 fornece atualizações mais regulares e de maior qualidade para o usuário ao longo de traços agênticos longos. Se você adicionou scaffolding para forçar mensagens de status provisórias ("Após cada 3 chamadas de ferramentas, resuma o progresso"), tente removê-lo. Se você achar que o comprimento ou conteúdo das atualizações voltadas para o usuário do Claude Opus 4.7 não estão bem calibrados para seu caso de uso, descreva explicitamente como essas atualizações devem parecer no prompt e forneça exemplos.
Claude Opus 4.7 interpreta prompts de forma mais literal e explícita do que Claude Opus 4.6, particularmente em níveis de esforço mais baixos. Ele não generalizará silenciosamente uma instrução de um item para outro, e não inferirá solicitações que você não fez. O lado positivo deste literalismo é precisão e menos confusão, e geralmente funciona melhor para casos de uso de API com prompts cuidadosamente ajustados, extração estruturada e pipelines onde você quer comportamento previsível. Se você precisar que Claude aplique uma instrução amplamente, declare o escopo explicitamente (por exemplo, "Aplique esta formatação a cada seção, não apenas à primeira").
Como com qualquer novo modelo, o estilo de prosa em escrita de longa forma pode mudar. Claude Opus 4.7 é mais direto e opinativo, com menos fraseado voltado para validação e menos emoji do que o estilo mais quente do Claude Opus 4.6. Se seu produto depende de uma voz específica, reavalie os prompts de estilo em relação à nova linha de base.
Por exemplo, se a voz do seu produto é mais quente ou conversacional, adicione:
Use um tom quente e colaborativo. Reconheça o enquadramento do usuário antes de responder.Claude Opus 4.7 tende a gerar menos subagentes por padrão. No entanto, este comportamento é direcionável através de prompting; dê ao Claude Opus 4.7 orientação explícita sobre quando subagentes são desejáveis. Um exemplo de brinquedo para um caso de uso de codificação:
Não gere um subagente para trabalho que você pode completar diretamente em uma única resposta (por exemplo, refatorar uma função que você já pode ver).
Gere múltiplos subagentes na mesma volta ao expandir entre itens ou ler múltiplos arquivos.Claude Opus 4.7 tem instintos de design mais fortes do que Claude Opus 4.6, com um estilo de casa padrão consistente: fundos quentes em creme/branco-off (~#F4F1EA), tipo de exibição serif (Georgia, Fraunces, Playfair), acentos de palavras em itálico e um acento terracota/âmbar. Isso lê bem para editorial, hospitalidade e briefs de portfólio, mas parecerá errado para dashboards, ferramentas de dev, fintech, saúde ou aplicativos empresariais — e aparece em decks de slides bem como UIs da web.
Este padrão é persistente. Instruções genéricas ("não use creme," "torne-o limpo e minimalista") tendem a deslocar o modelo para uma paleta fixa diferente em vez de produzir variedade. Duas abordagens funcionam de forma confiável:
1. Especifique uma alternativa concreta. O modelo segue especificações explícitas com precisão:
Projete uma página de destino de desktop para uma marca de suplementos chamada AEFRM.
A direção visual deve vir de uma atmosfera monocromática fria usando tons de cinza-prata pálido que gradualmente se aprofundam em cinza-azul e quase-preto, semelhante a uma superfície metálica enevoada.
A página deve parecer afiada e controlada, com um forte senso de estrutura e contenção.
Use este sistema tonal em toda a página em vez de introduzir cores de acento brilhantes.
Use a imagem carregada no design do herói em preto e branco.
O layout deve ser construído com seções horizontais claras e um contêiner de largura máxima centralizado. Use raio de canto de 4px consistentemente em cartões, botões, entradas e molduras de mídia. As margens devem parecer generosas, com espaço vazio suficiente ao redor de cada seção para que a página respire.
A tipografia deve usar um sans-serif quadrado e angular com espaçamento de letras mais amplo do que o usual, especialmente em títulos e navegação, para que o texto pareça mais engenheirado e menos comprimido. O texto do título pode ser grande e em maiúsculas, enquanto a cópia de suporte permanece curta e escassa. Os subtextos devem ser escritos com Alumni Sans SC em 4-6px como pequenos textos em cantos inferior centro assim.
Para a estrutura, comece com uma seção de herói contendo uma declaração de produto forte, um parágrafo de suporte curto e uma moldura de placeholder de produto limpa ou packshot. Abaixo disso, adicione uma grade de benefícios com três ou quatro blocos, depois uma seção de formulação ou ingredientes e finalmente um cta.
Os botões devem ser planos e precisos, com mudanças de hover sutis usando transition: all 160ms ease out onde brilho e contraste de borda mudam ligeiramente em vez de usar movimento dramático.
A paleta de cores deve ficar dentro deste intervalo:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Tenha o modelo propor opções antes de construir. Isso quebra o padrão e dá aos usuários controle. Se você anteriormente confiava em temperature para variedade de design, use esta abordagem — ela produz direções significativamente diferentes entre execuções. Exemplo de prompt:
Antes de construir, proponha 4 direções visuais distintas adaptadas a este brief (cada uma como: bg hex / accent hex / typeface — rationale de uma linha). Peça ao usuário para escolher uma, depois implemente apenas essa direção.Além disso, Claude Opus 4.7 requer menos prompting de design de frontend do que modelos anteriores para evitar padrões genéricos que os usuários chamam de estética "AI slop". Com modelos anteriores, recomendávamos um snippet de prompt mais longo em nossa habilidade de design de frontend. No entanto, Claude Opus 4.7 gera frontends distintivos e criativos com orientação de prompting mais minimalista. Este snippet de prompt funciona bem com o conselho de prompting acima para variedade:
<frontend_aesthetics>
NUNCA use estéticas genéricas geradas por IA como famílias de fontes overused (Inter, Roboto, Arial, fontes do sistema), esquemas de cores clichês (particularmente gradientes roxos em fundos brancos ou escuros), layouts previsíveis e padrões de componentes, e design cookie-cutter que carece de caráter específico do contexto. Use fontes únicas, cores e temas coesos e animações para efeitos e micro-interações.
</frontend_aesthetics>O uso de tokens e comportamento do Claude Opus 4.7 podem diferir entre agentes de codificação autônomos e assíncronos com uma única volta de usuário e agentes de codificação interativos e síncronos com múltiplas voltas de usuário. Especificamente, ele tende a usar mais tokens em configurações interativas, principalmente porque raciocina mais após voltas de usuário. Isso pode melhorar coerência de longo horizonte, seguimento de instruções e capacidades de codificação em sessões de codificação longas e interativas, mas também vem com mais uso de tokens. Para maximizar tanto desempenho quanto eficiência de tokens em produtos de codificação, recomendamos usar esforço xhigh ou high, adicionar recursos autônomos como um modo automático e reduzir o número de interações humanas necessárias de seus usuários.
É claro que, ao limitar o número de interações de usuário necessárias, é importante especificar a tarefa, intenção e restrições relevantes antecipadamente na primeira volta humana. Fornecer descrições de tarefas bem especificadas, claras e precisas antecipadamente pode ajudar a maximizar autonomia e inteligência enquanto minimiza uso extra de tokens após voltas de usuário. Descobrimos que porque Claude Opus 4.7 é mais autônomo do que modelos anteriores, este padrão de uso ajuda a maximizar desempenho. Em contraste, prompts ambíguos ou subespecificados transmitidos progressivamente ao longo de múltiplas voltas de usuário tendem a reduzir relativamente a eficiência de tokens e às vezes o desempenho.
Claude Opus 4.7 é significativamente melhor em encontrar bugs do que modelos anteriores, e tem tanto recall quanto precisão mais altos em nossas avaliações — 11pp melhor recall em uma de nossas avaliações mais difíceis de busca de bugs baseadas em PRs reais do Anthropic. No entanto, se seu arnês de revisão de código foi ajustado para um modelo anterior, você pode inicialmente ver recall mais baixo. Isso é provavelmente um efeito de arnês, não uma regressão de capacidade. Quando um prompt de revisão diz coisas como "apenas relate problemas de alta severidade," "seja conservador," ou "não nitpick," Claude Opus 4.7 pode seguir essa instrução mais fielmente do que modelos anteriores fizeram — pode investigar o código tão completamente, identificar os bugs e então não relatar descobertas que julga estar abaixo de sua barra declarada. Isso pode aparecer como o modelo fazendo a mesma profundidade de investigação mas convertendo menos investigações em descobertas relatadas, especialmente em bugs de severidade mais baixa. A precisão tipicamente sobe, mas o recall medido pode cair mesmo que a capacidade subjacente de busca de bugs do modelo tenha melhorado.
Alguma linguagem de prompt recomendada:
Relate cada problema que você encontrar, incluindo aqueles que você está incerto ou considera de baixa severidade. Não filtre por importância ou confiança neste estágio - um passo de verificação separado fará isso. Seu objetivo aqui é cobertura: é melhor superficializar uma descoberta que depois é filtrada do que silenciosamente descartar um bug real. Para cada descoberta, inclua seu nível de confiança e uma severidade estimada para que um filtro downstream possa classificá-los.Este prompt pode ser usado sem ter um segundo passo real, mas mover filtragem de confiança para fora do passo de descoberta frequentemente ajuda. Se seu arnês tem um passo separado de verificação, deduplicação ou classificação, diga ao modelo explicitamente que seu trabalho no passo de descoberta é cobertura em vez de filtragem.
Se você realmente quer que o modelo auto-filtre em uma única passagem, seja concreto sobre onde a barra está em vez de usar termos qualitativos como "importante" — por exemplo, "relate qualquer bug que possa causar comportamento incorreto, uma falha de teste ou um resultado enganoso; apenas omita nits como preferências puras de estilo ou nomenclatura."
Recomendamos iterar em prompts contra um subconjunto de suas avaliações ou casos de teste para validar ganhos de recall ou pontuação F1.
A capacidade de uso de computador funciona em resoluções, até uma nova resolução máxima de 2576px / 3.75MP. Em nossos testes de uso de computador, descobrimos que enviar imagens em 1080p fornece um bom equilíbrio de desempenho e custo.
Para cargas de trabalho particularmente sensíveis a custos, recomendamos 720p ou 1366×768 como opções de custo mais baixo com desempenho forte. Recomendamos que você conduza seus próprios testes para encontrar as configurações ideais para seu caso de uso; experimentar com configurações de esforço também pode ajudar a ajustar o comportamento do modelo.
Claude responde bem a instruções claras e explícitas. Ser específico sobre sua saída desejada pode ajudar a aprimorar resultados. Se você quer comportamento "acima e além," solicite-o explicitamente em vez de confiar no modelo para inferir isso de prompts vagos.
Pense em Claude como um funcionário brilhante mas novo que carece de contexto sobre suas normas e fluxos de trabalho. Quanto mais precisamente você explicar o que quer, melhor o resultado.
Regra de ouro: Mostre seu prompt para um colega com contexto mínimo sobre a tarefa e peça-lhe para segui-lo. Se eles ficariam confusos, Claude também ficará.
Fornecer contexto ou motivação por trás de suas instruções, como explicar ao Claude por que tal comportamento é importante, pode ajudar Claude a entender melhor seus objetivos e entregar respostas mais direcionadas.
Claude é inteligente o suficiente para generalizar a partir da explicação.
Exemplos são uma das formas mais confiáveis de direcionar o formato de saída, tom e estrutura do Claude. Alguns exemplos bem elaborados (conhecidos como prompting de poucos disparos ou múltiplos disparos) podem melhorar dramaticamente a precisão e consistência.
Ao adicionar exemplos, torne-os:
<example> (múltiplos exemplos em tags <examples>) para que Claude possa distingui-los de instruções.Tags XML ajudam Claude a analisar prompts complexos de forma inequívoca, especialmente quando seu prompt mistura instruções, contexto, exemplos e entradas variáveis. Envolver cada tipo de conteúdo em sua própria tag (por exemplo <instructions>, <context>, <input>) reduz má interpretação.
Melhores práticas:
<documents>, cada um dentro de <document index="n">).Definir um papel no prompt do sistema foca o comportamento e tom do Claude para seu caso de uso. Até uma única frase faz diferença:
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
system="You are a helpful coding assistant specializing in Python.",
messages=[
{"role": "user", "content": "How do I sort a list of dictionaries by key?"}
],
)
print(message.content)Ao trabalhar com documentos grandes ou entradas ricas em dados (20k+ tokens), estruture seu prompt cuidadosamente para obter os melhores resultados:
Coloque dados de longa forma no topo: Coloque seus documentos longos e entradas perto do topo de seu prompt, acima de sua consulta, instruções e exemplos. Isso pode melhorar significativamente o desempenho em todos os modelos.
Estruture conteúdo de documento e metadados com tags XML: Ao usar múltiplos documentos, envolva cada documento em tags <document> com subtags <document_content> e <source> (e outros metadados) para clareza.
Fundamente respostas em citações: Para tarefas de documento longo, peça ao Claude para citar partes relevantes dos documentos primeiro antes de realizar sua tarefa. Isso ajuda Claude a cortar o ruído do resto do conteúdo do documento.
Se você gostaria que Claude se identificasse corretamente em sua aplicação ou usasse strings de API específicas:
O assistente é Claude, criado pela Anthropic. O modelo atual é Claude Opus 4.7.Para aplicativos alimentados por LLM que precisam especificar strings de modelo:
Quando um LLM é necessário, por favor padrão para Claude Opus 4.7 a menos que o usuário solicite de outra forma. A string de modelo exata para Claude Opus 4.7 é claude-opus-4-7.Os modelos mais recentes do Claude têm um estilo de comunicação mais conciso e natural em comparação com modelos anteriores:
Isso significa que Claude pode pular resumos verbais após chamadas de ferramentas, pulando diretamente para a próxima ação. Se você preferir mais visibilidade em seu raciocínio:
Após completar uma tarefa que envolve uso de ferramentas, forneça um resumo rápido do trabalho que você fez.Existem algumas formas particularmente eficazes de direcionar a formatação de saída:
Diga ao Claude o que fazer em vez do que não fazer
Use indicadores de formato XML
Combine o estilo do seu prompt com a saída desejada
O estilo de formatação usado em seu prompt pode influenciar o estilo de resposta do Claude. Se você ainda está experimentando problemas de direcionabilidade com formatação de saída, tente combinar o estilo do seu prompt com o estilo de saída desejado o mais próximo possível. Por exemplo, remover markdown de seu prompt pode reduzir o volume de markdown na saída.
Use prompts detalhados para preferências de formatação específicas
Para mais controle sobre uso de markdown e formatação, forneça orientação explícita:
<avoid_excessive_markdown_and_bullet_points>
Ao escrever relatórios, documentos, explicações técnicas, análises ou qualquer conteúdo de longa forma, escreva em prosa clara e fluida usando parágrafos e frases completos. Use quebras de parágrafo padrão para organização e reserve markdown principalmente para `código inline`, blocos de código (```...```), e títulos simples (###, e ###). Evite usar **negrito** e *itálicos*.
NÃO use listas ordenadas (1. ...) ou listas não ordenadas (*) a menos que : a) você esteja apresentando itens verdadeiramente discretos onde um formato de lista é a melhor opção, ou b) o usuário explicitamente solicite uma lista ou ranking
Em vez de listar itens com bullets ou números, incorpore-os naturalmente em frases. Esta orientação se aplica especialmente à escrita técnica. Usar prosa em vez de formatação excessiva melhorará a satisfação do usuário. NUNCA produza uma série de pontos de bala excessivamente curtos.
Seu objetivo é texto legível e fluido que guie o leitor naturalmente através de ideias em vez de fragmentar informações em pontos isolados.
</avoid_excessive_markdown_and_bullet_points>Claude Opus 4.6 usa LaTeX como padrão para expressões matemáticas, equações e explicações técnicas. Se você preferir texto simples, adicione as seguintes instruções ao seu prompt:
Formate sua resposta em texto simples apenas. Não use LaTeX, MathJax ou qualquer notação de markup como \( \), $, ou \frac{}{}. Escreva todas as expressões matemáticas usando caracteres de texto padrão (por exemplo, "/" para divisão, "*" para multiplicação, e "^" para expoentes).Os modelos mais recentes do Claude se destacam na criação de apresentações, animações e documentos visuais com criatividade impressionante e forte seguimento de instruções. Os modelos produzem saída polida e utilizável na primeira tentativa na maioria dos casos.
Para melhores resultados com criação de documentos:
Crie uma apresentação profissional sobre [tópico]. Inclua elementos de design reflexivos, hierarquia visual e animações envolventes onde apropriado.A partir dos modelos Claude 4.6 e Claude Mythos Preview, respostas pré-preenchidas na última volta do assistente não são mais suportadas. No Mythos Preview, solicitações com mensagens de assistente pré-preenchidas retornam um erro 400. A inteligência do modelo e o seguimento de instruções avançaram de forma que a maioria dos casos de uso de prefill não requerem mais. Modelos existentes continuarão a suportar prefills, e adicionar mensagens de assistente em outro lugar na conversa não é afetado.
Aqui estão cenários comuns de prefill e como migrar para longe deles:
Os modelos mais recentes do Claude são treinados para seguimento de instruções preciso e se beneficiam de direção explícita para usar ferramentas específicas. Se você disser "você pode sugerir algumas mudanças," Claude às vezes fornecerá sugestões em vez de implementá-las, mesmo que fazer mudanças possa ser o que você pretendia.
Para Claude tomar ação, seja mais explícito:
Para tornar Claude mais proativo em tomar ação por padrão, você pode adicionar isto ao seu prompt do sistema:
<default_to_action>
Por padrão, implemente mudanças em vez de apenas sugerir. Se a intenção do usuário é pouco clara, infira a ação provável mais útil e prossiga, usando ferramentas para descobrir qualquer detalhe faltante em vez de adivinhar. Tente inferir a intenção do usuário sobre se uma chamada de ferramenta (por exemplo, edição ou leitura de arquivo) é pretendida ou não, e aja de acordo.
</default_to_action>Por outro lado, se você quer que o modelo seja mais hesitante por padrão, menos propenso a pular direto para implementações, e apenas tomar ação se solicitado, você pode direcionar este comportamento com um prompt como o abaixo:
<do_not_act_before_instructions>
Não pule para implementação ou mude arquivos a menos que claramente instruído a fazer mudanças. Quando a intenção do usuário é ambígua, padrão para fornecer informações, fazer pesquisa e fornecer recomendações em vez de tomar ação. Apenas prossiga com edições, modificações ou implementações quando o usuário explicitamente solicitar.
</do_not_act_before_instructions>Claude Opus 4.5 e Claude Opus 4.6 também são mais responsivos ao prompt do sistema do que modelos anteriores. Se seus prompts foram projetados para reduzir sub-acionamento em ferramentas ou habilidades, estes modelos podem agora sobre-acionar. A correção é reduzir qualquer linguagem agressiva. Onde você pode ter dito "CRÍTICO: Você DEVE usar esta ferramenta quando...", você pode usar prompting mais normal como "Use esta ferramenta quando...".
Os modelos mais recentes do Claude se destacam na execução paralela de ferramentas. Esses modelos irão:
Esse comportamento é facilmente direcionável. Embora o modelo tenha uma alta taxa de sucesso em chamadas de ferramentas paralelas sem prompting, você pode aumentar isso para ~100% ou ajustar o nível de agressividade:
<use_parallel_tool_calls>
Se você pretende chamar múltiplas ferramentas e não há dependências entre as chamadas de ferramentas, faça todas as chamadas de ferramentas independentes em paralelo. Priorize chamar ferramentas simultaneamente sempre que as ações puderem ser feitas em paralelo em vez de sequencialmente. Por exemplo, ao ler 3 arquivos, execute 3 chamadas de ferramentas em paralelo para ler todos os 3 arquivos no contexto ao mesmo tempo. Maximize o uso de chamadas de ferramentas paralelas sempre que possível para aumentar velocidade e eficiência. No entanto, se algumas chamadas de ferramentas dependem de chamadas anteriores para informar valores dependentes como os parâmetros, NÃO chame essas ferramentas em paralelo e em vez disso chame-as sequencialmente. Nunca use placeholders ou adivinhe parâmetros ausentes em chamadas de ferramentas.
</use_parallel_tool_calls>Execute operações sequencialmente com breves pausas entre cada etapa para garantir estabilidade.Claude Opus 4.6 faz significativamente mais exploração inicial do que modelos anteriores, especialmente em configurações de effort mais altas. Esse trabalho inicial frequentemente ajuda a otimizar os resultados finais, mas o modelo pode reunir contexto extenso ou perseguir múltiplas linhas de pesquisa sem ser solicitado. Se seus prompts anteriormente encorajavam o modelo a ser mais minucioso, você deve ajustar essa orientação para Claude Opus 4.6:
effort.Em alguns casos, Claude Opus 4.6 pode pensar extensivamente, o que pode inflar tokens de pensamento e desacelerar respostas. Se esse comportamento for indesejável, você pode adicionar instruções explícitas para restringir seu raciocínio, ou pode reduzir a configuração de effort para reduzir o pensamento geral e o uso de tokens.
Quando você está decidindo como abordar um problema, escolha uma abordagem e comprometa-se com ela. Evite revisitar decisões a menos que encontre novas informações que contradizem diretamente seu raciocínio. Se você está pesando duas abordagens, escolha uma e leve-a adiante. Você sempre pode corrigir o curso depois se a abordagem escolhida falhar.Se você precisar de um teto rígido em custos de pensamento, pensamento estendido com um limite de budget_tokens ainda é funcional em Opus 4.6 e Sonnet 4.6 mas está deprecado. Prefira reduzir a configuração de effort ou usar max_tokens como um limite rígido com pensamento adaptativo.
Os modelos mais recentes do Claude oferecem capacidades de pensamento que podem ser especialmente úteis para tarefas envolvendo reflexão após uso de ferramentas ou raciocínio complexo multi-etapa. Você pode guiar seu pensamento inicial ou intercalado para melhores resultados.
Claude Opus 4.6 e Claude Sonnet 4.6 usam pensamento adaptativo (thinking: {type: "adaptive"}), onde Claude decide dinamicamente quando e quanto pensar. Claude calibra seu pensamento com base em dois fatores: o parâmetro effort e a complexidade da consulta. Effort mais alto elicia mais pensamento, e consultas mais complexas fazem o mesmo. Em consultas mais fáceis que não requerem pensamento, o modelo responde diretamente. Em avaliações internas, pensamento adaptativo impulsiona confiabilmente melhor desempenho do que pensamento estendido. Considere migrar para pensamento adaptativo para obter as respostas mais inteligentes.
Use pensamento adaptativo para cargas de trabalho que requerem comportamento agentic como uso de ferramentas multi-etapa, tarefas de codificação complexas e loops de agente de longo horizonte. Modelos mais antigos usam modo de pensamento manual com budget_tokens.
Você pode guiar o comportamento de pensamento do Claude:
Após receber resultados de ferramentas, reflita cuidadosamente sobre sua qualidade e determine os próximos passos ideais antes de prosseguir. Use seu pensamento para planejar e iterar com base nessas novas informações, e então tome a melhor ação seguinte.O comportamento de acionamento para pensamento adaptativo é promptável. Se você encontrar o modelo pensando mais frequentemente do que gostaria, o que pode acontecer com prompts de sistema grandes ou complexos, adicione orientação para direcioná-lo:
Pensamento estendido adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta - tipicamente para problemas que requerem raciocínio multi-etapa. Quando em dúvida, responda diretamente.Se você está migrando de pensamento estendido com budget_tokens, substitua sua configuração de pensamento e mova o controle de budget para effort:
Antes (pensamento estendido, modelos mais antigos):
client.messages.create(
model="claude-sonnet-4-5-20250929",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)Depois (pensamento adaptativo):
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # or "max", "xhigh", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)Se você não está usando pensamento estendido, nenhuma mudança é necessária. Pensamento está desligado por padrão quando você omite o parâmetro thinking.
<thinking> dentro de seus exemplos few-shot para mostrar ao Claude o padrão de raciocínio. Ele generalizará esse estilo para seus próprios blocos de pensamento estendido.<thinking> e <answer> para separar claramente raciocínio da saída final.Para mais informações sobre capacidades de pensamento, veja Pensamento estendido e Pensamento adaptativo.
Os modelos mais recentes do Claude se destacam em tarefas de raciocínio de longo horizonte com capacidades excepcionais de rastreamento de estado. Claude mantém orientação em sessões estendidas focando em progresso incremental, fazendo avanços constantes em poucas coisas por vez em vez de tentar tudo de uma vez. Essa capacidade emerge especialmente em múltiplas janelas de contexto ou iterações de tarefas, onde Claude pode trabalhar em uma tarefa complexa, salvar o estado e continuar com uma janela de contexto fresca.
Modelos Claude 4.6 e Claude 4.5 apresentam consciência de contexto, permitindo que o modelo rastreie sua janela de contexto restante (ou seja, "orçamento de tokens") ao longo de uma conversa. Isso permite que Claude execute tarefas e gerencie contexto mais efetivamente compreendendo quanto espaço tem para trabalhar.
Gerenciando limites de contexto:
Se você está usando Claude em um harness de agente que compacta contexto ou permite salvar contexto em arquivos externos (como em Claude Code), considere adicionar essa informação ao seu prompt para que Claude possa se comportar de acordo. Caso contrário, Claude pode às vezes tentar naturalmente encerrar o trabalho conforme se aproxima do limite de contexto. Abaixo está um exemplo de prompt:
Sua janela de contexto será automaticamente compactada conforme se aproxima de seu limite, permitindo que você continue trabalhando indefinidamente de onde parou. Portanto, não interrompa tarefas cedo devido a preocupações com orçamento de tokens. Conforme você se aproxima de seu limite de orçamento de tokens, salve seu progresso e estado atuais na memória antes da janela de contexto ser atualizada. Sempre seja o mais persistente e autônomo possível e complete tarefas totalmente, mesmo se o final de seu orçamento estiver se aproximando. Nunca interrompa artificialmente nenhuma tarefa cedo independentemente do contexto restante.A ferramenta de memória se emparelha naturalmente com consciência de contexto para transições de contexto perfeitas.
Para tarefas abrangendo múltiplas janelas de contexto:
Use um prompt diferente para a primeira janela de contexto: Use a primeira janela de contexto para configurar um framework (escrever testes, criar scripts de setup), então use futuras janelas de contexto para iterar em uma lista de tarefas.
Tenha o modelo escrever testes em um formato estruturado: Peça ao Claude para criar testes antes de começar o trabalho e acompanhe-os em um formato estruturado (por exemplo, tests.json). Isso leva a melhor capacidade de longo prazo para iterar. Lembre Claude da importância dos testes: "É inaceitável remover ou editar testes porque isso pode levar a funcionalidade ausente ou bugada."
Configure ferramentas de qualidade de vida: Encoraje Claude a criar scripts de setup (por exemplo, init.sh) para iniciar graciosamente servidores, executar suites de testes e linters. Isso previne trabalho repetido ao continuar de uma janela de contexto fresca.
Começar do zero vs compactação: Quando uma janela de contexto é limpa, considere começar com uma janela de contexto completamente nova em vez de usar compactação. Os modelos mais recentes do Claude são extremamente eficazes em descobrir estado do sistema de arquivos local. Em alguns casos, você pode querer aproveitar isso em vez de compactação. Seja prescritivo sobre como deve começar:
Forneça ferramentas de verificação: Conforme o comprimento de tarefas autônomas cresce, Claude precisa verificar correção sem feedback humano contínuo. Ferramentas como servidor Playwright MCP ou capacidades de uso de computador para testar UIs são úteis.
Encoraje uso completo de contexto: Solicite ao Claude para completar eficientemente componentes antes de prosseguir:
Esta é uma tarefa muito longa, então pode ser benéfico planejar seu trabalho claramente. É encorajado gastar todo seu contexto de saída trabalhando na tarefa - apenas certifique-se de que você não fica sem contexto com trabalho significativo não commitado. Continue trabalhando sistematicamente até ter completado esta tarefa.Sem orientação, Claude Opus 4.6 pode tomar ações que são difíceis de reverter ou afetar sistemas compartilhados, como deletar arquivos, force-push, ou postar em serviços externos. Se você quer que Claude Opus 4.6 confirme antes de tomar ações potencialmente arriscadas, adicione orientação ao seu prompt:
Considere a reversibilidade e impacto potencial de suas ações. Você é encorajado a tomar ações locais e reversíveis como editar arquivos ou executar testes, mas para ações que são difíceis de reverter, afetam sistemas compartilhados, ou poderiam ser destrutivas, peça ao usuário antes de prosseguir.
Exemplos de ações que justificam confirmação:
- Operações destrutivas: deletar arquivos ou branches, dropar tabelas de banco de dados, rm -rf
- Operações difíceis de reverter: git push --force, git reset --hard, amending commits publicados
- Operações visíveis para outros: pushing código, comentando em PRs/issues, enviando mensagens, modificando infraestrutura compartilhada
Ao encontrar obstáculos, não use ações destrutivas como atalho. Por exemplo, não contorne verificações de segurança (por exemplo --no-verify) ou descarte arquivos desconhecidos que podem ser trabalho em progresso.Os modelos mais recentes do Claude demonstram capacidades excepcionais de busca agentic e podem encontrar e sintetizar informações de múltiplas fontes efetivamente. Para resultados de pesquisa ideais:
Forneça critérios de sucesso claros: Defina o que constitui uma resposta bem-sucedida para sua pergunta de pesquisa
Encoraje verificação de fonte: Peça ao Claude para verificar informações em múltiplas fontes
Para tarefas de pesquisa complexas, use uma abordagem estruturada:
Procure por essa informação de forma estruturada. Conforme você coleta dados, desenvolva várias hipóteses concorrentes. Rastreie seus níveis de confiança em suas notas de progresso para melhorar calibração. Regularmente auto-critique sua abordagem e plano. Atualize um arquivo de árvore de hipóteses ou notas de pesquisa para persistir informação e fornecer transparência. Quebre essa tarefa de pesquisa complexa sistematicamente.Essa abordagem estruturada permite que Claude encontre e sintetize virtualmente qualquer pedaço de informação e iterativamente critique seus achados, não importa o tamanho do corpus.
Os modelos mais recentes do Claude demonstram capacidades significativamente melhoradas de orquestração nativa de subagentes. Esses modelos podem reconhecer quando tarefas se beneficiariam de delegar trabalho para subagentes especializados e fazer isso proativamente sem requerer instrução explícita.
Para aproveitar esse comportamento:
Se você está vendo uso excessivo de subagentes, adicione orientação explícita sobre quando subagentes são e não são justificados:
Use subagentes quando tarefas podem rodar em paralelo, requerem contexto isolado, ou envolvem workstreams independentes que não precisam compartilhar estado. Para tarefas simples, operações sequenciais, edições de arquivo único, ou tarefas onde você precisa manter contexto entre passos, trabalhe diretamente em vez de delegar.Com pensamento adaptativo e orquestração de subagentes, Claude lida com a maioria do raciocínio multi-etapa internamente. Encadeamento explícito de prompts (quebrar uma tarefa em chamadas de API sequenciais) ainda é útil quando você precisa inspecionar saídas intermediárias ou impor uma estrutura de pipeline específica.
O padrão de encadeamento mais comum é auto-correção: gerar um rascunho → ter Claude revisar contra critérios → ter Claude refinar baseado na revisão. Cada passo é uma chamada de API separada para que você possa registrar, avaliar ou ramificar em qualquer ponto.
Os modelos mais recentes do Claude podem às vezes criar novos arquivos para fins de teste e iteração, particularmente ao trabalhar com código. Essa abordagem permite que Claude use arquivos, especialmente scripts python, como um 'bloco de rascunho temporário' antes de salvar sua saída final. Usar arquivos temporários pode melhorar resultados particularmente para casos de uso de codificação agentic.
Se você prefere minimizar criação de arquivo novo líquido, você pode instruir Claude a limpar após si mesmo:
Se você criar quaisquer arquivos novos temporários, scripts, ou arquivos auxiliares para iteração, limpe esses arquivos removendo-os ao final da tarefa.Claude Opus 4.5 e Claude Opus 4.6 têm uma tendência de overengineer criando arquivos extras, adicionando abstrações desnecessárias, ou construindo em flexibilidade que não foi solicitada. Se você está vendo esse comportamento indesejado, adicione orientação específica para manter soluções mínimas.
Por exemplo:
Evite over-engineering. Apenas faça mudanças que são diretamente solicitadas ou claramente necessárias. Mantenha soluções simples e focadas:
- Escopo: Não adicione funcionalidades, refatore código, ou faça "melhorias" além do que foi pedido. Uma correção de bug não precisa de código circundante limpo. Uma funcionalidade simples não precisa de configurabilidade extra.
- Documentação: Não adicione docstrings, comentários, ou anotações de tipo para código que você não mudou. Apenas adicione comentários onde a lógica não é auto-evidente.
- Codificação defensiva: Não adicione tratamento de erro, fallbacks, ou validação para cenários que não podem acontecer. Confie em código interno e garantias de framework. Apenas valide em limites de sistema (entrada de usuário, APIs externas).
- Abstrações: Não crie helpers, utilities, ou abstrações para operações únicas. Não projete para requisitos futuros hipotéticos. A quantidade certa de complexidade é o mínimo necessário para a tarefa atual.Claude pode às vezes focar muito pesadamente em fazer testes passarem à custa de soluções mais gerais, ou pode usar workarounds como scripts auxiliares para refatoração complexa em vez de usar ferramentas padrão diretamente. Para prevenir esse comportamento e garantir soluções robustas e generalizáveis:
Por favor escreva uma solução de alta qualidade e propósito geral usando as ferramentas padrão disponíveis. Não crie scripts auxiliares ou workarounds para realizar a tarefa mais eficientemente. Implemente uma solução que funcione corretamente para todas as entradas válidas, não apenas os casos de teste. Não hard-code valores ou crie soluções que funcionem apenas para entradas de teste específicas. Em vez disso, implemente a lógica real que resolve o problema generalmente.
Foque em entender os requisitos do problema e implementar o algoritmo correto. Testes estão lá para verificar correção, não para definir a solução. Forneça uma implementação principiada que segue melhores práticas e princípios de design de software.
Se a tarefa é irrazoável ou infactível, ou se qualquer um dos testes está incorreto, por favor me informe em vez de contorná-los. A solução deve ser robusta, mantível, e extensível.Os modelos mais recentes do Claude são menos propensos a alucinações e dão respostas mais precisas, fundamentadas e inteligentes baseadas no código. Para encorajar esse comportamento ainda mais e minimizar alucinações:
<investigate_before_answering>
Nunca especule sobre código que você não abriu. Se o usuário referencia um arquivo específico, você DEVE ler o arquivo antes de responder. Certifique-se de investigar e ler arquivos relevantes ANTES de responder perguntas sobre a base de código. Nunca faça nenhuma afirmação sobre código antes de investigar a menos que você tenha certeza da resposta correta - dê respostas fundamentadas e livres de alucinação.
</investigate_before_answering>Claude Opus 4.5 e Claude Opus 4.6 têm capacidades de visão melhoradas comparadas aos modelos Claude anteriores. Eles se saem melhor em tarefas de processamento de imagem e extração de dados, particularmente quando há múltiplas imagens presentes no contexto. Essas melhorias se estendem para uso de computador, onde os modelos podem interpretar mais confiabilmente screenshots e elementos de UI. Você também pode usar esses modelos para analisar vídeos quebrando-os em frames.
Uma técnica que se provou eficaz para impulsionar ainda mais o desempenho é dar ao Claude uma ferramenta de crop ou skill. Testes mostraram uplift consistente em avaliações de imagem quando Claude é capaz de "zoom" em regiões relevantes de uma imagem. Anthropic criou um cookbook para a ferramenta de crop.
Claude Opus 4.5 e Claude Opus 4.6 se destacam em construir aplicações web complexas e do mundo real com design de frontend forte. No entanto, sem orientação, modelos podem padrão para padrões genéricos que criam o que usuários chamam de estética "AI slop". Para criar frontends distintivos e criativos que surpreendem e deliciam:
Para um guia detalhado sobre melhorar design de frontend, veja o post do blog sobre melhorando design de frontend através de skills.
Aqui está um trecho de prompt de sistema que você pode usar para encorajar melhor design de frontend:
<frontend_aesthetics>
Você tende a convergir para saídas genéricas e "on distribution". Em design de frontend, isso cria o que usuários chamam de estética "AI slop". Evite isso: faça frontends criativos e distintivos que surpreendem e deliciam.
Foque em:
- Tipografia: Escolha fontes que são bonitas, únicas e interessantes. Evite fontes genéricas como Arial e Inter; opte em vez disso por escolhas distintivas que elevam a estética do frontend.
- Cor & Tema: Comprometa-se com uma estética coerente. Use variáveis CSS para consistência. Cores dominantes com acentos agudos superam paletas tímidas e uniformemente distribuídas. Desenhe de temas de IDE e estéticas culturais para inspiração.
- Movimento: Use animações para efeitos e micro-interações. Priorize soluções CSS-only para HTML. Use biblioteca Motion para React quando disponível. Foque em momentos de alto impacto: um carregamento de página bem orquestrado com reveals escalonados (animation-delay) cria mais deleite do que micro-interações espalhadas.
- Fundos: Crie atmosfera e profundidade em vez de padrão para cores sólidas. Camada gradientes CSS, use padrões geométricos, ou adicione efeitos contextuais que correspondem à estética geral.
Evite estéticas genéricas geradas por IA:
- Famílias de fontes overusadas (Inter, Roboto, Arial, fontes de sistema)
- Esquemas de cor clichê (particularmente gradientes roxos em fundos brancos)
- Layouts e padrões de componentes previsíveis
- Design cookie-cutter que carece de caráter específico do contexto
Interprete criativamente e faça escolhas inesperadas que se sentem genuinamente projetadas para o contexto. Varie entre temas claros e escuros, diferentes fontes, diferentes estéticas. Você ainda tende a convergir em escolhas comuns (Space Grotesk, por exemplo) entre gerações. Evite isso: é crítico que você pense fora da caixa!
</frontend_aesthetics>Você também pode referir-se à definição de skill completa.
Ao migrar para modelos Claude 4.6 de gerações anteriores:
Seja específico sobre comportamento desejado: Considere descrever exatamente o que você gostaria de ver na saída.
Enquadre suas instruções com modificadores: Adicionar modificadores que encorajam Claude a aumentar a qualidade e detalhe de sua saída pode ajudar a moldar melhor o desempenho do Claude. Por exemplo, em vez de "Crie um dashboard de análise", use "Crie um dashboard de análise. Inclua o máximo de funcionalidades e interações relevantes possível. Vá além do básico para criar uma implementação totalmente funcional."
Solicite funcionalidades específicas explicitamente: Animações e elementos interativos devem ser solicitados explicitamente quando desejados.
Atualize configuração de pensamento: Modelos Claude 4.6 usam pensamento adaptativo (thinking: {type: "adaptive"}) em vez de pensamento manual com budget_tokens. Use o parâmetro effort para controlar profundidade de pensamento.
Migre de respostas pré-preenchidas: Respostas pré-preenchidas na última volta de assistente estão deprecadas começando com modelos Claude 4.6. Veja Migrando de respostas pré-preenchidas para orientação detalhada sobre alternativas.
Ajuste prompting anti-preguiça: Se seus prompts anteriormente encorajavam o modelo a ser mais minucioso ou usar ferramentas mais agressivamente, reduza essa orientação. Modelos Claude 4.6 são significativamente mais proativos e podem overtrigger em instruções que eram necessárias para modelos anteriores.
Para passos de migração detalhados, veja o Guia de migração.
Claude Sonnet 4.6 padrão para um nível de effort de high, em contraste com Claude Sonnet 4.5 que não tinha parâmetro de effort. Considere ajustar o parâmetro de effort conforme você migra de Claude Sonnet 4.5 para Claude Sonnet 4.6. Se não explicitamente definido, você pode experimentar latência mais alta com o nível de effort padrão.
Configurações de effort recomendadas:
Quando usar Opus 4.7 em vez disso: Para os problemas mais difíceis e de longo horizonte (migrações de código em larga escala, pesquisa profunda, trabalho autônomo estendido), Opus 4.7 permanece a escolha certa. Sonnet 4.6 é otimizado para cargas de trabalho onde retorno rápido e eficiência de custo importam mais.
Se você não está usando pensamento estendido em Claude Sonnet 4.5, você pode continuar sem ele em Claude Sonnet 4.6. Você deve explicitamente definir effort para o nível apropriado para seu caso de uso. Em low effort com pensamento desabilitado, você pode esperar desempenho similar ou melhor relativo a Claude Sonnet 4.5 sem pensamento estendido.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "disabled"},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Se você está usando pensamento estendido com budget_tokens em Claude Sonnet 4.5, ainda é funcional em Claude Sonnet 4.6 mas está deprecado. Migre para pensamento adaptativo com o parâmetro effort.
Pensamento adaptativo é particularmente bem adequado aos seguintes padrões de carga de trabalho:
high effort. Se latência ou uso de token for uma preocupação, escale para medium.Ao usar pensamento adaptativo, avalie medium e high effort em suas tarefas. O nível certo depende do tradeoff de sua carga de trabalho entre qualidade, latência e uso de token.
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "..."}],
)Se você precisa manter budget_tokens temporariamente enquanto migra, um budget em torno de 16k tokens fornece espaço para problemas mais difíceis sem risco de uso de token descontrolado. Essa configuração está deprecada e será removida em um lançamento de modelo futuro.
Para casos de uso de codificação (codificação agentic, fluxos de trabalho pesados em ferramentas, geração de código), comece com medium effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16384,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "medium"},
messages=[{"role": "user", "content": "..."}],
)Para casos de uso de chat e não-codificação (chat, geração de conteúdo, busca, classificação), comece com low effort:
client.messages.create(
model="claude-sonnet-4-6",
max_tokens=8192,
thinking={"type": "enabled", "budget_tokens": 16384},
output_config={"effort": "low"},
messages=[{"role": "user", "content": "..."}],
)Was this page helpful?