Melhores práticas de prompting

ConstruirEngenharia de prompt

Melhores práticas de prompting

Guia abrangente de técnicas de engenharia de prompts para os modelos mais recentes do Claude, cobrindo clareza, exemplos, estruturação XML, pensamento e sistemas agênticos.

Esta é a referência única para engenharia de prompts com os modelos mais recentes do Claude, incluindo Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6 e Claude Haiku 4.5. Ela cobre técnicas fundamentais, controle de saída, uso de ferramentas, pensamento e sistemas agênticos. Vá para a seção que corresponde à sua situação.

Para uma visão geral das capacidades do modelo, consulte a visão geral dos modelos. Para detalhes sobre o que há de novo no Claude Opus 4.7, consulte O que há de novo no Claude Opus 4.7. Para orientação de migração, consulte o Guia de migração.

Prompting Claude Opus 4.7

Claude Opus 4.7 é nosso modelo mais capaz disponível em geral, com forças particulares em trabalho agêntico de longo horizonte, trabalho de conhecimento, visão e tarefas de memória. Ele funciona bem imediatamente em prompts existentes do Claude Opus 4.6. Os padrões abaixo cobrem os comportamentos que mais frequentemente requerem ajuste.

Para mudanças de parâmetros de API ao migrar do Claude Opus 4.6 (níveis de esforço, orçamentos de tarefas, configuração de pensamento, remoção de parâmetros de amostragem e tokenização), consulte o guia de migração.

Comprimento da resposta e verbosidade

Claude Opus 4.7 calibra o comprimento da resposta de acordo com a complexidade que julga a tarefa ter, em vez de usar uma verbosidade fixa padrão. Isso geralmente significa respostas mais curtas em buscas simples e muito mais longas em análises abertas.

Se seu produto depende de um certo estilo ou verbosidade de saída, você pode precisar ajustar seus prompts. Como exemplo, para diminuir a verbosidade, você pode adicionar:

Forneça respostas concisas e focadas. Pule contexto não essencial e mantenha exemplos mínimos.

Se você vir exemplos específicos de tipos de verbosidade (ou seja, sobre-explicação), pode adicionar instruções adicionais em seu prompt para evitá-los. Exemplos positivos mostrando como Claude pode se comunicar com o nível apropriado de concisão tendem a ser mais eficazes do que exemplos negativos ou instruções que dizem ao modelo o que não fazer.

Calibrando esforço e profundidade de pensamento

O parâmetro de esforço permite que você ajuste a inteligência do Claude versus gasto de tokens, negociando capacidade por velocidade mais rápida e custos mais baixos. Comece com o novo nível de esforço xhigh para codificação e casos de uso agênticos, e use um mínimo de esforço high para a maioria dos casos de uso sensíveis à inteligência. Experimente outros níveis de esforço para ajustar ainda mais o uso de tokens e inteligência:

max: O esforço máximo pode entregar ganhos de desempenho em alguns casos de uso, mas pode mostrar retornos decrescentes do aumento do uso de tokens. Esta configuração também pode às vezes ser propensa a excesso de pensamento. Recomendamos testar esforço máximo para tarefas que exigem inteligência.
xhigh (novo): Esforço extra alto é a melhor configuração para a maioria dos casos de uso de codificação e agênticos.
high: Esta configuração equilibra o uso de tokens e inteligência. Para a maioria dos casos de uso sensíveis à inteligência, recomendamos um mínimo de esforço high.
medium: Bom para casos de uso sensíveis a custos que precisam reduzir o uso de tokens enquanto negociam inteligência.
low: Reserve para tarefas curtas e escopo definido e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.

Mudando significativamente do Claude Opus 4.6, Claude Opus 4.7 respeita os níveis de esforço estritamente, especialmente na extremidade inferior. Em low e medium, o modelo limita seu trabalho ao que foi solicitado em vez de ir além. Isso é bom para latência e custo, mas em tarefas moderadamente complexas executadas com esforço low há algum risco de sub-pensamento.

Se você observar raciocínio superficial em problemas complexos, aumente o esforço para high ou xhigh em vez de contornar com prompting. Se você precisar manter o esforço em low para latência, adicione orientação direcionada:

Esta tarefa envolve raciocínio em múltiplas etapas. Pense cuidadosamente sobre o problema antes de responder.

Esperamos que o esforço seja mais importante para este modelo do que para qualquer Opus anterior, e recomendamos experimentar com ele ativamente quando você fizer upgrade.

O comportamento de acionamento para pensamento adaptativo é direcionável. Se você achar que o modelo está pensando mais frequentemente do que gostaria — o que pode acontecer com prompts de sistema grandes ou complexos — adicione orientação para direcioná-lo. Como sempre, meça o efeito de qualquer mudança de prompting no desempenho. Exemplo:

Pensar adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta — tipicamente para problemas que requerem raciocínio em múltiplas etapas. Em caso de dúvida, responda diretamente.

Inversamente, se você estiver executando cargas de trabalho difíceis em medium e vendo sub-pensamento, a primeira alavanca é aumentar o esforço. Se você precisar de controle mais fino, peça por isso diretamente.

Se você estiver executando Claude Opus 4.7 com esforço max ou xhigh, defina um grande orçamento máximo de tokens de saída para que o modelo tenha espaço para pensar e agir em seus subagentes e chamadas de ferramentas. Recomendamos começar com 64k tokens e ajustar a partir daí.

Acionamento de uso de ferramentas

Claude Opus 4.7 tem uma tendência de usar ferramentas com menos frequência do que Claude Opus 4.6 e usar raciocínio mais. Isso produz melhores resultados na maioria dos casos. No entanto, aumentar a configuração de esforço é uma alavanca útil para aumentar o nível de uso de ferramentas, especialmente em trabalho de conhecimento. As configurações de esforço high ou xhigh mostram substancialmente mais uso de ferramentas em busca agêntica e codificação. Para cenários onde você quer mais uso de ferramentas, você também pode ajustar seu prompt para instruir explicitamente o modelo sobre quando e como usar adequadamente suas ferramentas. Por exemplo, se você achar que o modelo não está usando suas ferramentas de busca na web, descreva claramente por que e como deveria.

Atualizações de progresso voltadas para o usuário

Claude Opus 4.7 fornece atualizações mais regulares e de maior qualidade para o usuário ao longo de traços agênticos longos. Se você adicionou scaffolding para forçar mensagens de status provisórias ("Após cada 3 chamadas de ferramentas, resuma o progresso"), tente removê-lo. Se você achar que o comprimento ou conteúdo das atualizações voltadas para o usuário do Claude Opus 4.7 não estão bem calibrados para seu caso de uso, descreva explicitamente como essas atualizações devem parecer no prompt e forneça exemplos.

Seguimento de instruções mais literal

Claude Opus 4.7 interpreta prompts de forma mais literal e explícita do que Claude Opus 4.6, particularmente em níveis de esforço mais baixos. Ele não generalizará silenciosamente uma instrução de um item para outro, e não inferirá solicitações que você não fez. O lado positivo deste literalismo é precisão e menos confusão, e geralmente funciona melhor para casos de uso de API com prompts cuidadosamente ajustados, extração estruturada e pipelines onde você quer comportamento previsível. Se você precisar que Claude aplique uma instrução amplamente, declare o escopo explicitamente (por exemplo, "Aplique esta formatação a cada seção, não apenas à primeira").

Tom e estilo de escrita

Como com qualquer novo modelo, o estilo de prosa em escrita de longa forma pode mudar. Claude Opus 4.7 é mais direto e opinativo, com menos fraseado voltado para validação e menos emoji do que o estilo mais quente do Claude Opus 4.6. Se seu produto depende de uma voz específica, reavalie os prompts de estilo em relação à nova linha de base.

Por exemplo, se a voz do seu produto é mais quente ou conversacional, adicione:

Use um tom quente e colaborativo. Reconheça o enquadramento do usuário antes de responder.

Controlando geração de subagentes

Claude Opus 4.7 tende a gerar menos subagentes por padrão. No entanto, este comportamento é direcionável através de prompting; dê ao Claude Opus 4.7 orientação explícita sobre quando subagentes são desejáveis. Um exemplo de brinquedo para um caso de uso de codificação:

Não gere um subagente para trabalho que você pode completar diretamente em uma única resposta (por exemplo, refatorar uma função que você já pode ver).

Gere múltiplos subagentes na mesma volta ao expandir entre itens ou ler múltiplos arquivos.

Padrões de design e frontend

Claude Opus 4.7 tem instintos de design mais fortes do que Claude Opus 4.6, com um estilo de casa padrão consistente: fundos quentes em creme/branco-off (~#F4F1EA), tipo de exibição serif (Georgia, Fraunces, Playfair), acentos de palavras em itálico e um acento terracota/âmbar. Isso lê bem para editorial, hospitalidade e briefs de portfólio, mas parecerá errado para dashboards, ferramentas de dev, fintech, saúde ou aplicativos empresariais — e aparece em decks de slides bem como UIs da web.

Este padrão é persistente. Instruções genéricas ("não use creme," "torne-o limpo e minimalista") tendem a deslocar o modelo para uma paleta fixa diferente em vez de produzir variedade. Duas abordagens funcionam de forma confiável:

1. Especifique uma alternativa concreta. O modelo segue especificações explícitas com precisão:

Projete uma página de destino de desktop para uma marca de suplementos chamada AEFRM.

A direção visual deve vir de uma atmosfera monocromática fria usando tons de cinza-prata pálido que gradualmente se aprofundam em cinza-azul e quase-preto, semelhante a uma superfície metálica enevoada.

A página deve parecer afiada e controlada, com um forte senso de estrutura e contenção.

Use este sistema tonal em toda a página em vez de introduzir cores de acento brilhantes.

Use a imagem carregada no design do herói em preto e branco.

O layout deve ser construído com seções horizontais claras e um contêiner de largura máxima centralizado. Use raio de canto de 4px consistentemente em cartões, botões, entradas e molduras de mídia. As margens devem parecer generosas, com espaço vazio suficiente ao redor de cada seção para que a página respire.

A tipografia deve usar um sans-serif quadrado e angular com espaçamento de letras mais amplo do que o usual, especialmente em títulos e navegação, para que o texto pareça mais engenheirado e menos comprimido. O texto do título pode ser grande e em maiúsculas, enquanto a cópia de suporte permanece curta e escassa. Os subtextos devem ser escritos com Alumni Sans SC em 4-6px como pequenos textos em cantos inferior centro assim.

Para a estrutura, comece com uma seção de herói contendo uma declaração de produto forte, um parágrafo de suporte curto e uma moldura de placeholder de produto limpa ou packshot. Abaixo disso, adicione uma grade de benefícios com três ou quatro blocos, depois uma seção de formulação ou ingredientes e finalmente um cta.

Os botões devem ser planos e precisos, com mudanças de hover sutis usando transition: all 160ms ease out onde brilho e contraste de borda mudam ligeiramente em vez de usar movimento dramático.

A paleta de cores deve ficar dentro deste intervalo:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

2. Tenha o modelo propor opções antes de construir. Isso quebra o padrão e dá aos usuários controle. Se você anteriormente confiava em temperature para variedade de design, use esta abordagem — ela produz direções significativamente diferentes entre execuções. Exemplo de prompt:

Antes de construir, proponha 4 direções visuais distintas adaptadas a este brief (cada uma como: bg hex / accent hex / typeface — rationale de uma linha). Peça ao usuário para escolher uma, depois implemente apenas essa direção.

Além disso, Claude Opus 4.7 requer menos prompting de design de frontend do que modelos anteriores para evitar padrões genéricos que os usuários chamam de estética "AI slop". Com modelos anteriores, recomendávamos um snippet de prompt mais longo em nossa habilidade de design de frontend. No entanto, Claude Opus 4.7 gera frontends distintivos e criativos com orientação de prompting mais minimalista. Este snippet de prompt funciona bem com o conselho de prompting acima para variedade:

<frontend_aesthetics>
NUNCA use estéticas genéricas geradas por IA como famílias de fontes overused (Inter, Roboto, Arial, fontes do sistema), esquemas de cores clichês (particularmente gradientes roxos em fundos brancos ou escuros), layouts previsíveis e padrões de componentes, e design cookie-cutter que carece de caráter específico do contexto. Use fontes únicas, cores e temas coesos e animações para efeitos e micro-interações.
</frontend_aesthetics>

Produtos de codificação interativa

O uso de tokens e comportamento do Claude Opus 4.7 podem diferir entre agentes de codificação autônomos e assíncronos com uma única volta de usuário e agentes de codificação interativos e síncronos com múltiplas voltas de usuário. Especificamente, ele tende a usar mais tokens em configurações interativas, principalmente porque raciocina mais após voltas de usuário. Isso pode melhorar coerência de longo horizonte, seguimento de instruções e capacidades de codificação em sessões de codificação longas e interativas, mas também vem com mais uso de tokens. Para maximizar tanto desempenho quanto eficiência de tokens em produtos de codificação, recomendamos usar esforço xhigh ou high, adicionar recursos autônomos como um modo automático e reduzir o número de interações humanas necessárias de seus usuários.

É claro que, ao limitar o número de interações de usuário necessárias, é importante especificar a tarefa, intenção e restrições relevantes antecipadamente na primeira volta humana. Fornecer descrições de tarefas bem especificadas, claras e precisas antecipadamente pode ajudar a maximizar autonomia e inteligência enquanto minimiza uso extra de tokens após voltas de usuário. Descobrimos que porque Claude Opus 4.7 é mais autônomo do que modelos anteriores, este padrão de uso ajuda a maximizar desempenho. Em contraste, prompts ambíguos ou subespecificados transmitidos progressivamente ao longo de múltiplas voltas de usuário tendem a reduzir relativamente a eficiência de tokens e às vezes o desempenho.

Arneses de revisão de código

Claude Opus 4.7 é significativamente melhor em encontrar bugs do que modelos anteriores, e tem tanto recall quanto precisão mais altos em nossas avaliações — 11pp melhor recall em uma de nossas avaliações mais difíceis de busca de bugs baseadas em PRs reais do Anthropic. No entanto, se seu arnês de revisão de código foi ajustado para um modelo anterior, você pode inicialmente ver recall mais baixo. Isso é provavelmente um efeito de arnês, não uma regressão de capacidade. Quando um prompt de revisão diz coisas como "apenas relate problemas de alta severidade," "seja conservador," ou "não nitpick," Claude Opus 4.7 pode seguir essa instrução mais fielmente do que modelos anteriores fizeram — pode investigar o código tão completamente, identificar os bugs e então não relatar descobertas que julga estar abaixo de sua barra declarada. Isso pode aparecer como o modelo fazendo a mesma profundidade de investigação mas convertendo menos investigações em descobertas relatadas, especialmente em bugs de severidade mais baixa. A precisão tipicamente sobe, mas o recall medido pode cair mesmo que a capacidade subjacente de busca de bugs do modelo tenha melhorado.

Alguma linguagem de prompt recomendada:

Relate cada problema que você encontrar, incluindo aqueles que você está incerto ou considera de baixa severidade. Não filtre por importância ou confiança neste estágio - um passo de verificação separado fará isso. Seu objetivo aqui é cobertura: é melhor superficializar uma descoberta que depois é filtrada do que silenciosamente descartar um bug real. Para cada descoberta, inclua seu nível de confiança e uma severidade estimada para que um filtro downstream possa classificá-los.

Este prompt pode ser usado sem ter um segundo passo real, mas mover filtragem de confiança para fora do passo de descoberta frequentemente ajuda. Se seu arnês tem um passo separado de verificação, deduplicação ou classificação, diga ao modelo explicitamente que seu trabalho no passo de descoberta é cobertura em vez de filtragem.

Se você realmente quer que o modelo auto-filtre em uma única passagem, seja concreto sobre onde a barra está em vez de usar termos qualitativos como "importante" — por exemplo, "relate qualquer bug que possa causar comportamento incorreto, uma falha de teste ou um resultado enganoso; apenas omita nits como preferências puras de estilo ou nomenclatura."

Recomendamos iterar em prompts contra um subconjunto de suas avaliações ou casos de teste para validar ganhos de recall ou pontuação F1.

Uso de computador

A capacidade de uso de computador funciona em resoluções, até uma nova resolução máxima de 2576px / 3.75MP. Em nossos testes de uso de computador, descobrimos que enviar imagens em 1080p fornece um bom equilíbrio de desempenho e custo.

Para cargas de trabalho particularmente sensíveis a custos, recomendamos 720p ou 1366×768 como opções de custo mais baixo com desempenho forte. Recomendamos que você conduza seus próprios testes para encontrar as configurações ideais para seu caso de uso; experimentar com configurações de esforço também pode ajudar a ajustar o comportamento do modelo.

Princípios gerais

Seja claro e direto

Claude responde bem a instruções claras e explícitas. Ser específico sobre sua saída desejada pode ajudar a aprimorar resultados. Se você quer comportamento "acima e além," solicite-o explicitamente em vez de confiar no modelo para inferir isso de prompts vagos.

Pense em Claude como um funcionário brilhante mas novo que carece de contexto sobre suas normas e fluxos de trabalho. Quanto mais precisamente você explicar o que quer, melhor o resultado.

Regra de ouro: Mostre seu prompt para um colega com contexto mínimo sobre a tarefa e peça-lhe para segui-lo. Se eles ficariam confusos, Claude também ficará.

Seja específico sobre o formato de saída desejado e restrições.
Forneça instruções como etapas sequenciais usando listas numeradas ou pontos de bala quando a ordem ou completude das etapas importa.

Adicione contexto para melhorar o desempenho

Fornecer contexto ou motivação por trás de suas instruções, como explicar ao Claude por que tal comportamento é importante, pode ajudar Claude a entender melhor seus objetivos e entregar respostas mais direcionadas.

Claude é inteligente o suficiente para generalizar a partir da explicação.

Use exemplos efetivamente

Exemplos são uma das formas mais confiáveis de direcionar o formato de saída, tom e estrutura do Claude. Alguns exemplos bem elaborados (conhecidos como prompting de poucos disparos ou múltiplos disparos) podem melhorar dramaticamente a precisão e consistência.

Ao adicionar exemplos, torne-os:

Relevantes: Espelhe seu caso de uso real de perto.
Diversos: Cubra casos extremos e variem o suficiente para que Claude não pegue padrões não intencionais.
Estruturados: Envolva exemplos em tags <example> (múltiplos exemplos em tags <examples>) para que Claude possa distingui-los de instruções.

Inclua 3–5 exemplos para melhores resultados. Você também pode pedir ao Claude para avaliar seus exemplos para relevância e diversidade, ou para gerar exemplos adicionais baseados em seu conjunto inicial.

Estruture prompts com tags XML

Tags XML ajudam Claude a analisar prompts complexos de forma inequívoca, especialmente quando seu prompt mistura instruções, contexto, exemplos e entradas variáveis. Envolver cada tipo de conteúdo em sua própria tag (por exemplo <instructions>, <context>, <input>) reduz má interpretação.

Melhores práticas:

Use nomes de tags consistentes e descritivos em seus prompts.
Aninhe tags quando o conteúdo tem uma hierarquia natural (documentos dentro de <documents>, cada um dentro de <document index="n">).

Dê ao Claude um papel

Definir um papel no prompt do sistema foca o comportamento e tom do Claude para seu caso de uso. Até uma única frase faz diferença:

Python

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system="You are a helpful coding assistant specializing in Python.",
    messages=[
        {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
    ],
)
print(message.content)

Prompting de contexto longo

Ao trabalhar com documentos grandes ou entradas ricas em dados (20k+ tokens), estruture seu prompt cuidadosamente para obter os melhores resultados:

Coloque dados de longa forma no topo: Coloque seus documentos longos e entradas perto do topo de seu prompt, acima de sua consulta, instruções e exemplos. Isso pode melhorar significativamente o desempenho em todos os modelos.

Consultas no final podem melhorar a qualidade da resposta em até 30% em testes, especialmente com entradas complexas e multi-documento.
Estruture conteúdo de documento e metadados com tags XML: Ao usar múltiplos documentos, envolva cada documento em tags <document> com subtags <document_content> e <source> (e outros metadados) para clareza.
Fundamente respostas em citações: Para tarefas de documento longo, peça ao Claude para citar partes relevantes dos documentos primeiro antes de realizar sua tarefa. Isso ajuda Claude a cortar o ruído do resto do conteúdo do documento.

Autoconhecimento do modelo

Se você gostaria que Claude se identificasse corretamente em sua aplicação ou usasse strings de API específicas:

Exemplo de prompt para identidade do modelo

O assistente é Claude, criado pela Anthropic. O modelo atual é Claude Opus 4.7.

Para aplicativos alimentados por LLM que precisam especificar strings de modelo:

Exemplo de prompt para string de modelo

Quando um LLM é necessário, por favor padrão para Claude Opus 4.7 a menos que o usuário solicite de outra forma. A string de modelo exata para Claude Opus 4.7 é claude-opus-4-7.

Saída e formatação

Estilo de comunicação e verbosidade

Os modelos mais recentes do Claude têm um estilo de comunicação mais conciso e natural em comparação com modelos anteriores:

Mais direto e fundamentado: Fornece relatórios de progresso baseados em fatos em vez de atualizações auto-celebratórias
Mais conversacional: Ligeiramente mais fluente e coloquial, menos parecido com máquina
Menos verboso: Pode pular resumos verbais para eficiência a menos que solicitado de outra forma

Isso significa que Claude pode pular resumos verbais após chamadas de ferramentas, pulando diretamente para a próxima ação. Se você preferir mais visibilidade em seu raciocínio:

Exemplo de prompt

Após completar uma tarefa que envolve uso de ferramentas, forneça um resumo rápido do trabalho que você fez.

Controle o formato de respostas

Existem algumas formas particularmente eficazes de direcionar a formatação de saída:

Diga ao Claude o que fazer em vez do que não fazer
- Em vez de: "Não use markdown em sua resposta"
- Tente: "Sua resposta deve ser composta de parágrafos de prosa fluindo suavemente."
Use indicadores de formato XML
- Tente: "Escreva as seções de prosa de sua resposta em tags <smoothly_flowing_prose_paragraphs>."
Combine o estilo do seu prompt com a saída desejada

O estilo de formatação usado em seu prompt pode influenciar o estilo de resposta do Claude. Se você ainda está experimentando problemas de direcionabilidade com formatação de saída, tente combinar o estilo do seu prompt com o estilo de saída desejado o mais próximo possível. Por exemplo, remover markdown de seu prompt pode reduzir o volume de markdown na saída.
Use prompts detalhados para preferências de formatação específicas

Para mais controle sobre uso de markdown e formatação, forneça orientação explícita:

Exemplo de prompt para minimizar markdown

<avoid_excessive_markdown_and_bullet_points>
Ao escrever relatórios, documentos, explicações técnicas, análises ou qualquer conteúdo de longa forma, escreva em prosa clara e fluida usando parágrafos e frases completos. Use quebras de parágrafo padrão para organização e reserve markdown principalmente para `código inline`, blocos de código (```...```), e títulos simples (###, e ###). Evite usar **negrito** e *itálicos*.

NÃO use listas ordenadas (1. ...) ou listas não ordenadas (*) a menos que : a) você esteja apresentando itens verdadeiramente discretos onde um formato de lista é a melhor opção, ou b) o usuário explicitamente solicite uma lista ou ranking

Em vez de listar itens com bullets ou números, incorpore-os naturalmente em frases. Esta orientação se aplica especialmente à escrita técnica. Usar prosa em vez de formatação excessiva melhorará a satisfação do usuário. NUNCA produza uma série de pontos de bala excessivamente curtos.

Seu objetivo é texto legível e fluido que guie o leitor naturalmente através de ideias em vez de fragmentar informações em pontos isolados.
</avoid_excessive_markdown_and_bullet_points>

Saída LaTeX

Claude Opus 4.6 usa LaTeX como padrão para expressões matemáticas, equações e explicações técnicas. Se você preferir texto simples, adicione as seguintes instruções ao seu prompt:

Exemplo de prompt

Formate sua resposta em texto simples apenas. Não use LaTeX, MathJax ou qualquer notação de markup como \( \), $, ou \frac{}{}. Escreva todas as expressões matemáticas usando caracteres de texto padrão (por exemplo, "/" para divisão, "*" para multiplicação, e "^" para expoentes).

Criação de documentos

Os modelos mais recentes do Claude se destacam na criação de apresentações, animações e documentos visuais com criatividade impressionante e forte seguimento de instruções. Os modelos produzem saída polida e utilizável na primeira tentativa na maioria dos casos.

Para melhores resultados com criação de documentos:

Exemplo de prompt

Crie uma apresentação profissional sobre [tópico]. Inclua elementos de design reflexivos, hierarquia visual e animações envolventes onde apropriado.

Migrando de respostas pré-preenchidas

A partir dos modelos Claude 4.6 e Claude Mythos Preview, respostas pré-preenchidas na última volta do assistente não são mais suportadas. No Mythos Preview, solicitações com mensagens de assistente pré-preenchidas retornam um erro 400. A inteligência do modelo e o seguimento de instruções avançaram de forma que a maioria dos casos de uso de prefill não requerem mais. Modelos existentes continuarão a suportar prefills, e adicionar mensagens de assistente em outro lugar na conversa não é afetado.

Aqui estão cenários comuns de prefill e como migrar para longe deles:

Uso de ferramentas

Os modelos mais recentes do Claude são treinados para seguimento de instruções preciso e se beneficiam de direção explícita para usar ferramentas específicas. Se você disser "você pode sugerir algumas mudanças," Claude às vezes fornecerá sugestões em vez de implementá-las, mesmo que fazer mudanças possa ser o que você pretendia.

Para Claude tomar ação, seja mais explícito:

Para tornar Claude mais proativo em tomar ação por padrão, você pode adicionar isto ao seu prompt do sistema:

Exemplo de prompt para ação proativa

<default_to_action>
Por padrão, implemente mudanças em vez de apenas sugerir. Se a intenção do usuário é pouco clara, infira a ação provável mais útil e prossiga, usando ferramentas para descobrir qualquer detalhe faltante em vez de adivinhar. Tente inferir a intenção do usuário sobre se uma chamada de ferramenta (por exemplo, edição ou leitura de arquivo) é pretendida ou não, e aja de acordo.
</default_to_action>

Por outro lado, se você quer que o modelo seja mais hesitante por padrão, menos propenso a pular direto para implementações, e apenas tomar ação se solicitado, você pode direcionar este comportamento com um prompt como o abaixo:

Exemplo de prompt para ação conservadora

<do_not_act_before_instructions>
Não pule para implementação ou mude arquivos a menos que claramente instruído a fazer mudanças. Quando a intenção do usuário é ambígua, padrão para fornecer informações, fazer pesquisa e fornecer recomendações em vez de tomar ação. Apenas prossiga com edições, modificações ou implementações quando o usuário explicitamente solicitar.
</do_not_act_before_instructions>

Claude Opus 4.5 e Claude Opus 4.6 também são mais responsivos ao prompt do sistema do que modelos anteriores. Se seus prompts foram projetados para reduzir sub-acionamento em ferramentas ou habilidades, estes modelos podem agora sobre-acionar. A correção é reduzir qualquer linguagem agressiva. Onde você pode ter dito "CRÍTICO: Você DEVE usar esta ferramenta quando...", você pode usar prompting mais normal como "Use esta ferramenta quando...".

Otimizar chamadas de ferramentas paralelas

Os modelos mais recentes do Claude se destacam na execução paralela de ferramentas. Esses modelos irão:

Executar múltiplas buscas especulativas durante pesquisa
Ler vários arquivos simultaneamente para construir contexto mais rapidamente
Executar comandos bash em paralelo (o que pode até criar gargalo no desempenho do sistema)

Esse comportamento é facilmente direcionável. Embora o modelo tenha uma alta taxa de sucesso em chamadas de ferramentas paralelas sem prompting, você pode aumentar isso para ~100% ou ajustar o nível de agressividade:

Exemplo de prompt para máxima eficiência paralela

<use_parallel_tool_calls>
Se você pretende chamar múltiplas ferramentas e não há dependências entre as chamadas de ferramentas, faça todas as chamadas de ferramentas independentes em paralelo. Priorize chamar ferramentas simultaneamente sempre que as ações puderem ser feitas em paralelo em vez de sequencialmente. Por exemplo, ao ler 3 arquivos, execute 3 chamadas de ferramentas em paralelo para ler todos os 3 arquivos no contexto ao mesmo tempo. Maximize o uso de chamadas de ferramentas paralelas sempre que possível para aumentar velocidade e eficiência. No entanto, se algumas chamadas de ferramentas dependem de chamadas anteriores para informar valores dependentes como os parâmetros, NÃO chame essas ferramentas em paralelo e em vez disso chame-as sequencialmente. Nunca use placeholders ou adivinhe parâmetros ausentes em chamadas de ferramentas.
</use_parallel_tool_calls>

Exemplo de prompt para reduzir execução paralela

Execute operações sequencialmente com breves pausas entre cada etapa para garantir estabilidade.

Pensamento e raciocínio

Excesso de pensamento e minuciosidade excessiva

Claude Opus 4.6 faz significativamente mais exploração inicial do que modelos anteriores, especialmente em configurações de effort mais altas. Esse trabalho inicial frequentemente ajuda a otimizar os resultados finais, mas o modelo pode reunir contexto extenso ou perseguir múltiplas linhas de pesquisa sem ser solicitado. Se seus prompts anteriormente encorajavam o modelo a ser mais minucioso, você deve ajustar essa orientação para Claude Opus 4.6:

Substitua padrões genéricos por instruções mais direcionadas. Em vez de "Padrão para usar [ferramenta]," adicione orientação como "Use [ferramenta] quando isso melhoraria sua compreensão do problema."
Remova excesso de prompting. Ferramentas que foram subtriggeradas em modelos anteriores provavelmente serão acionadas apropriadamente agora. Instruções como "Se em dúvida, use [ferramenta]" causarão overtriggering.
Use effort como fallback. Se Claude continuar sendo excessivamente agressivo, use uma configuração mais baixa para effort.

Em alguns casos, Claude Opus 4.6 pode pensar extensivamente, o que pode inflar tokens de pensamento e desacelerar respostas. Se esse comportamento for indesejável, você pode adicionar instruções explícitas para restringir seu raciocínio, ou pode reduzir a configuração de effort para reduzir o pensamento geral e o uso de tokens.

Exemplo de prompt

Quando você está decidindo como abordar um problema, escolha uma abordagem e comprometa-se com ela. Evite revisitar decisões a menos que encontre novas informações que contradizem diretamente seu raciocínio. Se você está pesando duas abordagens, escolha uma e leve-a adiante. Você sempre pode corrigir o curso depois se a abordagem escolhida falhar.

Se você precisar de um teto rígido em custos de pensamento, pensamento estendido com um limite de budget_tokens ainda é funcional em Opus 4.6 e Sonnet 4.6 mas está deprecado. Prefira reduzir a configuração de effort ou usar max_tokens como um limite rígido com pensamento adaptativo.

Aproveitar capacidades de pensamento e pensamento intercalado

Os modelos mais recentes do Claude oferecem capacidades de pensamento que podem ser especialmente úteis para tarefas envolvendo reflexão após uso de ferramentas ou raciocínio complexo multi-etapa. Você pode guiar seu pensamento inicial ou intercalado para melhores resultados.

Claude Opus 4.6 e Claude Sonnet 4.6 usam pensamento adaptativo (thinking: {type: "adaptive"}), onde Claude decide dinamicamente quando e quanto pensar. Claude calibra seu pensamento com base em dois fatores: o parâmetro effort e a complexidade da consulta. Effort mais alto elicia mais pensamento, e consultas mais complexas fazem o mesmo. Em consultas mais fáceis que não requerem pensamento, o modelo responde diretamente. Em avaliações internas, pensamento adaptativo impulsiona confiabilmente melhor desempenho do que pensamento estendido. Considere migrar para pensamento adaptativo para obter as respostas mais inteligentes.

Use pensamento adaptativo para cargas de trabalho que requerem comportamento agentic como uso de ferramentas multi-etapa, tarefas de codificação complexas e loops de agente de longo horizonte. Modelos mais antigos usam modo de pensamento manual com budget_tokens.

Você pode guiar o comportamento de pensamento do Claude:

Exemplo de prompt

Após receber resultados de ferramentas, reflita cuidadosamente sobre sua qualidade e determine os próximos passos ideais antes de prosseguir. Use seu pensamento para planejar e iterar com base nessas novas informações, e então tome a melhor ação seguinte.

O comportamento de acionamento para pensamento adaptativo é promptável. Se você encontrar o modelo pensando mais frequentemente do que gostaria, o que pode acontecer com prompts de sistema grandes ou complexos, adicione orientação para direcioná-lo:

Exemplo de prompt

Pensamento estendido adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta - tipicamente para problemas que requerem raciocínio multi-etapa. Quando em dúvida, responda diretamente.

Se você está migrando de pensamento estendido com budget_tokens, substitua sua configuração de pensamento e mova o controle de budget para effort:

Antes (pensamento estendido, modelos mais antigos):

Python

client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=64000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[{"role": "user", "content": "..."}],
)

Depois (pensamento adaptativo):

Python

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Se você não está usando pensamento estendido, nenhuma mudança é necessária. Pensamento está desligado por padrão quando você omite o parâmetro thinking.

Prefira instruções gerais em vez de passos prescritivos. Um prompt como "pense minuciosamente" frequentemente produz melhor raciocínio do que um plano passo-a-passo escrito à mão. O raciocínio do Claude frequentemente excede o que um humano prescreveria.
Exemplos multishot funcionam com pensamento. Use tags <thinking> dentro de seus exemplos few-shot para mostrar ao Claude o padrão de raciocínio. Ele generalizará esse estilo para seus próprios blocos de pensamento estendido.
CoT manual como fallback. Quando pensamento está desligado, você ainda pode encorajar raciocínio passo-a-passo pedindo ao Claude para pensar através do problema. Use tags estruturadas como <thinking> e <answer> para separar claramente raciocínio da saída final.
Peça ao Claude para auto-verificar. Acrescente algo como "Antes de terminar, verifique sua resposta contra [critérios de teste]." Isso captura erros confiabilmente, especialmente para codificação e matemática.

Quando pensamento estendido está desabilitado, Claude Opus 4.5 é particularmente sensível à palavra "think" e suas variantes. Considere usar alternativas como "consider," "evaluate," ou "reason through" nesses casos.

Para mais informações sobre capacidades de pensamento, veja Pensamento estendido e Pensamento adaptativo.

Sistemas agentic

Raciocínio de longo horizonte e rastreamento de estado

Os modelos mais recentes do Claude se destacam em tarefas de raciocínio de longo horizonte com capacidades excepcionais de rastreamento de estado. Claude mantém orientação em sessões estendidas focando em progresso incremental, fazendo avanços constantes em poucas coisas por vez em vez de tentar tudo de uma vez. Essa capacidade emerge especialmente em múltiplas janelas de contexto ou iterações de tarefas, onde Claude pode trabalhar em uma tarefa complexa, salvar o estado e continuar com uma janela de contexto fresca.

Consciência de contexto e fluxos de trabalho multi-janela

Modelos Claude 4.6 e Claude 4.5 apresentam consciência de contexto, permitindo que o modelo rastreie sua janela de contexto restante (ou seja, "orçamento de tokens") ao longo de uma conversa. Isso permite que Claude execute tarefas e gerencie contexto mais efetivamente compreendendo quanto espaço tem para trabalhar.

Gerenciando limites de contexto:

Se você está usando Claude em um harness de agente que compacta contexto ou permite salvar contexto em arquivos externos (como em Claude Code), considere adicionar essa informação ao seu prompt para que Claude possa se comportar de acordo. Caso contrário, Claude pode às vezes tentar naturalmente encerrar o trabalho conforme se aproxima do limite de contexto. Abaixo está um exemplo de prompt:

Exemplo de prompt

Sua janela de contexto será automaticamente compactada conforme se aproxima de seu limite, permitindo que você continue trabalhando indefinidamente de onde parou. Portanto, não interrompa tarefas cedo devido a preocupações com orçamento de tokens. Conforme você se aproxima de seu limite de orçamento de tokens, salve seu progresso e estado atuais na memória antes da janela de contexto ser atualizada. Sempre seja o mais persistente e autônomo possível e complete tarefas totalmente, mesmo se o final de seu orçamento estiver se aproximando. Nunca interrompa artificialmente nenhuma tarefa cedo independentemente do contexto restante.

A ferramenta de memória se emparelha naturalmente com consciência de contexto para transições de contexto perfeitas.

Fluxos de trabalho multi-janela de contexto

Para tarefas abrangendo múltiplas janelas de contexto:

Use um prompt diferente para a primeira janela de contexto: Use a primeira janela de contexto para configurar um framework (escrever testes, criar scripts de setup), então use futuras janelas de contexto para iterar em uma lista de tarefas.
Tenha o modelo escrever testes em um formato estruturado: Peça ao Claude para criar testes antes de começar o trabalho e acompanhe-os em um formato estruturado (por exemplo, tests.json). Isso leva a melhor capacidade de longo prazo para iterar. Lembre Claude da importância dos testes: "É inaceitável remover ou editar testes porque isso pode levar a funcionalidade ausente ou bugada."
Configure ferramentas de qualidade de vida: Encoraje Claude a criar scripts de setup (por exemplo, init.sh) para iniciar graciosamente servidores, executar suites de testes e linters. Isso previne trabalho repetido ao continuar de uma janela de contexto fresca.
Começar do zero vs compactação: Quando uma janela de contexto é limpa, considere começar com uma janela de contexto completamente nova em vez de usar compactação. Os modelos mais recentes do Claude são extremamente eficazes em descobrir estado do sistema de arquivos local. Em alguns casos, você pode querer aproveitar isso em vez de compactação. Seja prescritivo sobre como deve começar:
- "Chame pwd; você pode apenas ler e escrever arquivos neste diretório."
- "Revise progress.txt, tests.json, e os logs do git."
- "Execute manualmente um teste de integração fundamental antes de prosseguir para implementar novas funcionalidades."
Forneça ferramentas de verificação: Conforme o comprimento de tarefas autônomas cresce, Claude precisa verificar correção sem feedback humano contínuo. Ferramentas como servidor Playwright MCP ou capacidades de uso de computador para testar UIs são úteis.
Encoraje uso completo de contexto: Solicite ao Claude para completar eficientemente componentes antes de prosseguir:

Exemplo de prompt

Esta é uma tarefa muito longa, então pode ser benéfico planejar seu trabalho claramente. É encorajado gastar todo seu contexto de saída trabalhando na tarefa - apenas certifique-se de que você não fica sem contexto com trabalho significativo não commitado. Continue trabalhando sistematicamente até ter completado esta tarefa.

Melhores práticas de gerenciamento de estado

Use formatos estruturados para dados de estado: Ao rastrear informações estruturadas (como resultados de testes ou status de tarefas), use JSON ou outros formatos estruturados para ajudar Claude a entender requisitos de schema
Use texto não estruturado para notas de progresso: Notas de progresso em forma livre funcionam bem para rastrear progresso geral e contexto
Use git para rastreamento de estado: Git fornece um log do que foi feito e checkpoints que podem ser restaurados. Os modelos mais recentes do Claude se saem especialmente bem usando git para rastrear estado em múltiplas sessões.
Enfatize progresso incremental: Peça explicitamente ao Claude para acompanhar seu progresso e focar em trabalho incremental

Equilibrando autonomia e segurança

Sem orientação, Claude Opus 4.6 pode tomar ações que são difíceis de reverter ou afetar sistemas compartilhados, como deletar arquivos, force-push, ou postar em serviços externos. Se você quer que Claude Opus 4.6 confirme antes de tomar ações potencialmente arriscadas, adicione orientação ao seu prompt:

Exemplo de prompt

Considere a reversibilidade e impacto potencial de suas ações. Você é encorajado a tomar ações locais e reversíveis como editar arquivos ou executar testes, mas para ações que são difíceis de reverter, afetam sistemas compartilhados, ou poderiam ser destrutivas, peça ao usuário antes de prosseguir.

Exemplos de ações que justificam confirmação:
- Operações destrutivas: deletar arquivos ou branches, dropar tabelas de banco de dados, rm -rf
- Operações difíceis de reverter: git push --force, git reset --hard, amending commits publicados
- Operações visíveis para outros: pushing código, comentando em PRs/issues, enviando mensagens, modificando infraestrutura compartilhada

Ao encontrar obstáculos, não use ações destrutivas como atalho. Por exemplo, não contorne verificações de segurança (por exemplo --no-verify) ou descarte arquivos desconhecidos que podem ser trabalho em progresso.

Pesquisa e coleta de informações

Os modelos mais recentes do Claude demonstram capacidades excepcionais de busca agentic e podem encontrar e sintetizar informações de múltiplas fontes efetivamente. Para resultados de pesquisa ideais:

Forneça critérios de sucesso claros: Defina o que constitui uma resposta bem-sucedida para sua pergunta de pesquisa
Encoraje verificação de fonte: Peça ao Claude para verificar informações em múltiplas fontes
Para tarefas de pesquisa complexas, use uma abordagem estruturada:

Exemplo de prompt para pesquisa complexa

Procure por essa informação de forma estruturada. Conforme você coleta dados, desenvolva várias hipóteses concorrentes. Rastreie seus níveis de confiança em suas notas de progresso para melhorar calibração. Regularmente auto-critique sua abordagem e plano. Atualize um arquivo de árvore de hipóteses ou notas de pesquisa para persistir informação e fornecer transparência. Quebre essa tarefa de pesquisa complexa sistematicamente.

Essa abordagem estruturada permite que Claude encontre e sintetize virtualmente qualquer pedaço de informação e iterativamente critique seus achados, não importa o tamanho do corpus.

Orquestração de subagentes

Os modelos mais recentes do Claude demonstram capacidades significativamente melhoradas de orquestração nativa de subagentes. Esses modelos podem reconhecer quando tarefas se beneficiariam de delegar trabalho para subagentes especializados e fazer isso proativamente sem requerer instrução explícita.

Para aproveitar esse comportamento:

Garanta ferramentas de subagente bem-definidas: Tenha ferramentas de subagente disponíveis e descritas em definições de ferramentas
Deixe Claude orquestrar naturalmente: Claude delegará apropriadamente sem instrução explícita
Observe excesso de uso: Claude Opus 4.6 tem uma forte predileção por subagentes e pode gerá-los em situações onde uma abordagem mais simples e direta seria suficiente. Por exemplo, o modelo pode gerar subagentes para exploração de código quando uma chamada grep direta é mais rápida e suficiente.

Se você está vendo uso excessivo de subagentes, adicione orientação explícita sobre quando subagentes são e não são justificados:

Exemplo de prompt para uso de subagentes

Use subagentes quando tarefas podem rodar em paralelo, requerem contexto isolado, ou envolvem workstreams independentes que não precisam compartilhar estado. Para tarefas simples, operações sequenciais, edições de arquivo único, ou tarefas onde você precisa manter contexto entre passos, trabalhe diretamente em vez de delegar.

Encadear prompts complexos

Com pensamento adaptativo e orquestração de subagentes, Claude lida com a maioria do raciocínio multi-etapa internamente. Encadeamento explícito de prompts (quebrar uma tarefa em chamadas de API sequenciais) ainda é útil quando você precisa inspecionar saídas intermediárias ou impor uma estrutura de pipeline específica.

O padrão de encadeamento mais comum é auto-correção: gerar um rascunho → ter Claude revisar contra critérios → ter Claude refinar baseado na revisão. Cada passo é uma chamada de API separada para que você possa registrar, avaliar ou ramificar em qualquer ponto.

Reduzir criação de arquivos em codificação agentic

Os modelos mais recentes do Claude podem às vezes criar novos arquivos para fins de teste e iteração, particularmente ao trabalhar com código. Essa abordagem permite que Claude use arquivos, especialmente scripts python, como um 'bloco de rascunho temporário' antes de salvar sua saída final. Usar arquivos temporários pode melhorar resultados particularmente para casos de uso de codificação agentic.

Se você prefere minimizar criação de arquivo novo líquido, você pode instruir Claude a limpar após si mesmo:

Exemplo de prompt

Se você criar quaisquer arquivos novos temporários, scripts, ou arquivos auxiliares para iteração, limpe esses arquivos removendo-os ao final da tarefa.

Excesso de entusiasmo

Claude Opus 4.5 e Claude Opus 4.6 têm uma tendência de overengineer criando arquivos extras, adicionando abstrações desnecessárias, ou construindo em flexibilidade que não foi solicitada. Se você está vendo esse comportamento indesejado, adicione orientação específica para manter soluções mínimas.

Por exemplo:

Exemplo de prompt para minimizar overengineering

Evite over-engineering. Apenas faça mudanças que são diretamente solicitadas ou claramente necessárias. Mantenha soluções simples e focadas:

- Escopo: Não adicione funcionalidades, refatore código, ou faça "melhorias" além do que foi pedido. Uma correção de bug não precisa de código circundante limpo. Uma funcionalidade simples não precisa de configurabilidade extra.

- Documentação: Não adicione docstrings, comentários, ou anotações de tipo para código que você não mudou. Apenas adicione comentários onde a lógica não é auto-evidente.

- Codificação defensiva: Não adicione tratamento de erro, fallbacks, ou validação para cenários que não podem acontecer. Confie em código interno e garantias de framework. Apenas valide em limites de sistema (entrada de usuário, APIs externas).

- Abstrações: Não crie helpers, utilities, ou abstrações para operações únicas. Não projete para requisitos futuros hipotéticos. A quantidade certa de complexidade é o mínimo necessário para a tarefa atual.

Evitar focar em passar testes e hard-coding

Claude pode às vezes focar muito pesadamente em fazer testes passarem à custa de soluções mais gerais, ou pode usar workarounds como scripts auxiliares para refatoração complexa em vez de usar ferramentas padrão diretamente. Para prevenir esse comportamento e garantir soluções robustas e generalizáveis:

Exemplo de prompt

Por favor escreva uma solução de alta qualidade e propósito geral usando as ferramentas padrão disponíveis. Não crie scripts auxiliares ou workarounds para realizar a tarefa mais eficientemente. Implemente uma solução que funcione corretamente para todas as entradas válidas, não apenas os casos de teste. Não hard-code valores ou crie soluções que funcionem apenas para entradas de teste específicas. Em vez disso, implemente a lógica real que resolve o problema generalmente.

Foque em entender os requisitos do problema e implementar o algoritmo correto. Testes estão lá para verificar correção, não para definir a solução. Forneça uma implementação principiada que segue melhores práticas e princípios de design de software.

Se a tarefa é irrazoável ou infactível, ou se qualquer um dos testes está incorreto, por favor me informe em vez de contorná-los. A solução deve ser robusta, mantível, e extensível.

Minimizando alucinações em codificação agentic

Os modelos mais recentes do Claude são menos propensos a alucinações e dão respostas mais precisas, fundamentadas e inteligentes baseadas no código. Para encorajar esse comportamento ainda mais e minimizar alucinações:

Exemplo de prompt

<investigate_before_answering>
Nunca especule sobre código que você não abriu. Se o usuário referencia um arquivo específico, você DEVE ler o arquivo antes de responder. Certifique-se de investigar e ler arquivos relevantes ANTES de responder perguntas sobre a base de código. Nunca faça nenhuma afirmação sobre código antes de investigar a menos que você tenha certeza da resposta correta - dê respostas fundamentadas e livres de alucinação.
</investigate_before_answering>

Dicas específicas de capacidade

Capacidades de visão melhoradas

Claude Opus 4.5 e Claude Opus 4.6 têm capacidades de visão melhoradas comparadas aos modelos Claude anteriores. Eles se saem melhor em tarefas de processamento de imagem e extração de dados, particularmente quando há múltiplas imagens presentes no contexto. Essas melhorias se estendem para uso de computador, onde os modelos podem interpretar mais confiabilmente screenshots e elementos de UI. Você também pode usar esses modelos para analisar vídeos quebrando-os em frames.

Uma técnica que se provou eficaz para impulsionar ainda mais o desempenho é dar ao Claude uma ferramenta de crop ou skill. Testes mostraram uplift consistente em avaliações de imagem quando Claude é capaz de "zoom" em regiões relevantes de uma imagem. Anthropic criou um cookbook para a ferramenta de crop.

Design de frontend

Claude Opus 4.5 e Claude Opus 4.6 se destacam em construir aplicações web complexas e do mundo real com design de frontend forte. No entanto, sem orientação, modelos podem padrão para padrões genéricos que criam o que usuários chamam de estética "AI slop". Para criar frontends distintivos e criativos que surpreendem e deliciam:

Para um guia detalhado sobre melhorar design de frontend, veja o post do blog sobre melhorando design de frontend através de skills.

Aqui está um trecho de prompt de sistema que você pode usar para encorajar melhor design de frontend:

Exemplo de prompt para estética de frontend

<frontend_aesthetics>
Você tende a convergir para saídas genéricas e "on distribution". Em design de frontend, isso cria o que usuários chamam de estética "AI slop". Evite isso: faça frontends criativos e distintivos que surpreendem e deliciam.

Foque em:
- Tipografia: Escolha fontes que são bonitas, únicas e interessantes. Evite fontes genéricas como Arial e Inter; opte em vez disso por escolhas distintivas que elevam a estética do frontend.
- Cor & Tema: Comprometa-se com uma estética coerente. Use variáveis CSS para consistência. Cores dominantes com acentos agudos superam paletas tímidas e uniformemente distribuídas. Desenhe de temas de IDE e estéticas culturais para inspiração.
- Movimento: Use animações para efeitos e micro-interações. Priorize soluções CSS-only para HTML. Use biblioteca Motion para React quando disponível. Foque em momentos de alto impacto: um carregamento de página bem orquestrado com reveals escalonados (animation-delay) cria mais deleite do que micro-interações espalhadas.
- Fundos: Crie atmosfera e profundidade em vez de padrão para cores sólidas. Camada gradientes CSS, use padrões geométricos, ou adicione efeitos contextuais que correspondem à estética geral.

Evite estéticas genéricas geradas por IA:
- Famílias de fontes overusadas (Inter, Roboto, Arial, fontes de sistema)
- Esquemas de cor clichê (particularmente gradientes roxos em fundos brancos)
- Layouts e padrões de componentes previsíveis
- Design cookie-cutter que carece de caráter específico do contexto

Interprete criativamente e faça escolhas inesperadas que se sentem genuinamente projetadas para o contexto. Varie entre temas claros e escuros, diferentes fontes, diferentes estéticas. Você ainda tende a convergir em escolhas comuns (Space Grotesk, por exemplo) entre gerações. Evite isso: é crítico que você pense fora da caixa!
</frontend_aesthetics>

Você também pode referir-se à definição de skill completa.

Considerações de migração

Ao migrar para modelos Claude 4.6 de gerações anteriores:

Seja específico sobre comportamento desejado: Considere descrever exatamente o que você gostaria de ver na saída.
Enquadre suas instruções com modificadores: Adicionar modificadores que encorajam Claude a aumentar a qualidade e detalhe de sua saída pode ajudar a moldar melhor o desempenho do Claude. Por exemplo, em vez de "Crie um dashboard de análise", use "Crie um dashboard de análise. Inclua o máximo de funcionalidades e interações relevantes possível. Vá além do básico para criar uma implementação totalmente funcional."
Solicite funcionalidades específicas explicitamente: Animações e elementos interativos devem ser solicitados explicitamente quando desejados.
Atualize configuração de pensamento: Modelos Claude 4.6 usam pensamento adaptativo (thinking: {type: "adaptive"}) em vez de pensamento manual com budget_tokens. Use o parâmetro effort para controlar profundidade de pensamento.
Migre de respostas pré-preenchidas: Respostas pré-preenchidas na última volta de assistente estão deprecadas começando com modelos Claude 4.6. Veja Migrando de respostas pré-preenchidas para orientação detalhada sobre alternativas.
Ajuste prompting anti-preguiça: Se seus prompts anteriormente encorajavam o modelo a ser mais minucioso ou usar ferramentas mais agressivamente, reduza essa orientação. Modelos Claude 4.6 são significativamente mais proativos e podem overtrigger em instruções que eram necessárias para modelos anteriores.

Para passos de migração detalhados, veja o Guia de migração.

Migrando de Claude Sonnet 4.5 para Claude Sonnet 4.6

Claude Sonnet 4.6 padrão para um nível de effort de high, em contraste com Claude Sonnet 4.5 que não tinha parâmetro de effort. Considere ajustar o parâmetro de effort conforme você migra de Claude Sonnet 4.5 para Claude Sonnet 4.6. Se não explicitamente definido, você pode experimentar latência mais alta com o nível de effort padrão.

Configurações de effort recomendadas:

Medium para a maioria das aplicações
Low para cargas de trabalho de alto volume ou sensíveis a latência
Defina um grande orçamento de token de saída máxima (64k tokens recomendado) em medium ou high effort para dar ao modelo espaço para pensar e agir

Quando usar Opus 4.7 em vez disso: Para os problemas mais difíceis e de longo horizonte (migrações de código em larga escala, pesquisa profunda, trabalho autônomo estendido), Opus 4.7 permanece a escolha certa. Sonnet 4.6 é otimizado para cargas de trabalho onde retorno rápido e eficiência de custo importam mais.

Se você não está usando pensamento estendido

Se você não está usando pensamento estendido em Claude Sonnet 4.5, você pode continuar sem ele em Claude Sonnet 4.6. Você deve explicitamente definir effort para o nível apropriado para seu caso de uso. Em low effort com pensamento desabilitado, você pode esperar desempenho similar ou melhor relativo a Claude Sonnet 4.5 sem pensamento estendido.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "disabled"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Se você está usando pensamento estendido

Se você está usando pensamento estendido com budget_tokens em Claude Sonnet 4.5, ainda é funcional em Claude Sonnet 4.6 mas está deprecado. Migre para pensamento adaptativo com o parâmetro effort.

Migrando para pensamento adaptativo

Pensamento adaptativo é particularmente bem adequado aos seguintes padrões de carga de trabalho:

Agentes multi-etapa autônomos: agentes de codificação que transformam requisitos em software funcional, pipelines de análise de dados, e busca de bugs onde o modelo roda independentemente em muitos passos. Pensamento adaptativo permite que o modelo calibre seu raciocínio por passo, mantendo-se no caminho em trajetórias mais longas. Para essas cargas de trabalho, comece em high effort. Se latência ou uso de token for uma preocupação, escale para medium.
Agentes de uso de computador: Claude Sonnet 4.6 alcançou melhor acurácia em classe em avaliações de uso de computador usando modo adaptativo.
Cargas de trabalho bimodais: uma mistura de tarefas fáceis e difíceis onde adaptativo pula pensamento em consultas simples e raciocina profundamente em complexas.

Ao usar pensamento adaptativo, avalie medium e high effort em suas tarefas. O nível certo depende do tradeoff de sua carga de trabalho entre qualidade, latência e uso de token.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)

Mantendo budget_tokens durante migração

Se você precisa manter budget_tokens temporariamente enquanto migra, um budget em torno de 16k tokens fornece espaço para problemas mais difíceis sem risco de uso de token descontrolado. Essa configuração está deprecada e será removida em um lançamento de modelo futuro.

Para casos de uso de codificação (codificação agentic, fluxos de trabalho pesados em ferramentas, geração de código), comece com medium effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "..."}],
)

Para casos de uso de chat e não-codificação (chat, geração de conteúdo, busca, classificação), comece com low effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Was this page helpful?

ConstruirEngenharia de prompt

Melhores práticas de prompting

Guia abrangente de técnicas de engenharia de prompts para os modelos mais recentes do Claude, cobrindo clareza, exemplos, estruturação XML, pensamento e sistemas agênticos.

Prompting Claude Opus 4.7

Comprimento da resposta e verbosidade

Se seu produto depende de um certo estilo ou verbosidade de saída, você pode precisar ajustar seus prompts. Como exemplo, para diminuir a verbosidade, você pode adicionar:

Forneça respostas concisas e focadas. Pule contexto não essencial e mantenha exemplos mínimos.

Calibrando esforço e profundidade de pensamento

max: O esforço máximo pode entregar ganhos de desempenho em alguns casos de uso, mas pode mostrar retornos decrescentes do aumento do uso de tokens. Esta configuração também pode às vezes ser propensa a excesso de pensamento. Recomendamos testar esforço máximo para tarefas que exigem inteligência.
xhigh (novo): Esforço extra alto é a melhor configuração para a maioria dos casos de uso de codificação e agênticos.
high: Esta configuração equilibra o uso de tokens e inteligência. Para a maioria dos casos de uso sensíveis à inteligência, recomendamos um mínimo de esforço high.
medium: Bom para casos de uso sensíveis a custos que precisam reduzir o uso de tokens enquanto negociam inteligência.
low: Reserve para tarefas curtas e escopo definido e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.

Esta tarefa envolve raciocínio em múltiplas etapas. Pense cuidadosamente sobre o problema antes de responder.

Esperamos que o esforço seja mais importante para este modelo do que para qualquer Opus anterior, e recomendamos experimentar com ele ativamente quando você fizer upgrade.

Pensar adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta — tipicamente para problemas que requerem raciocínio em múltiplas etapas. Em caso de dúvida, responda diretamente.

Acionamento de uso de ferramentas

Atualizações de progresso voltadas para o usuário

Seguimento de instruções mais literal

Tom e estilo de escrita

Por exemplo, se a voz do seu produto é mais quente ou conversacional, adicione:

Use um tom quente e colaborativo. Reconheça o enquadramento do usuário antes de responder.

Controlando geração de subagentes

Não gere um subagente para trabalho que você pode completar diretamente em uma única resposta (por exemplo, refatorar uma função que você já pode ver).

Gere múltiplos subagentes na mesma volta ao expandir entre itens ou ler múltiplos arquivos.

Padrões de design e frontend

1. Especifique uma alternativa concreta. O modelo segue especificações explícitas com precisão:

Projete uma página de destino de desktop para uma marca de suplementos chamada AEFRM.

A direção visual deve vir de uma atmosfera monocromática fria usando tons de cinza-prata pálido que gradualmente se aprofundam em cinza-azul e quase-preto, semelhante a uma superfície metálica enevoada.

A página deve parecer afiada e controlada, com um forte senso de estrutura e contenção.

Use este sistema tonal em toda a página em vez de introduzir cores de acento brilhantes.

Use a imagem carregada no design do herói em preto e branco.

O layout deve ser construído com seções horizontais claras e um contêiner de largura máxima centralizado. Use raio de canto de 4px consistentemente em cartões, botões, entradas e molduras de mídia. As margens devem parecer generosas, com espaço vazio suficiente ao redor de cada seção para que a página respire.

A tipografia deve usar um sans-serif quadrado e angular com espaçamento de letras mais amplo do que o usual, especialmente em títulos e navegação, para que o texto pareça mais engenheirado e menos comprimido. O texto do título pode ser grande e em maiúsculas, enquanto a cópia de suporte permanece curta e escassa. Os subtextos devem ser escritos com Alumni Sans SC em 4-6px como pequenos textos em cantos inferior centro assim.

Para a estrutura, comece com uma seção de herói contendo uma declaração de produto forte, um parágrafo de suporte curto e uma moldura de placeholder de produto limpa ou packshot. Abaixo disso, adicione uma grade de benefícios com três ou quatro blocos, depois uma seção de formulação ou ingredientes e finalmente um cta.

Os botões devem ser planos e precisos, com mudanças de hover sutis usando transition: all 160ms ease out onde brilho e contraste de borda mudam ligeiramente em vez de usar movimento dramático.

A paleta de cores deve ficar dentro deste intervalo:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

Antes de construir, proponha 4 direções visuais distintas adaptadas a este brief (cada uma como: bg hex / accent hex / typeface — rationale de uma linha). Peça ao usuário para escolher uma, depois implemente apenas essa direção.

<frontend_aesthetics>
NUNCA use estéticas genéricas geradas por IA como famílias de fontes overused (Inter, Roboto, Arial, fontes do sistema), esquemas de cores clichês (particularmente gradientes roxos em fundos brancos ou escuros), layouts previsíveis e padrões de componentes, e design cookie-cutter que carece de caráter específico do contexto. Use fontes únicas, cores e temas coesos e animações para efeitos e micro-interações.
</frontend_aesthetics>

Produtos de codificação interativa

Arneses de revisão de código

Alguma linguagem de prompt recomendada:

Relate cada problema que você encontrar, incluindo aqueles que você está incerto ou considera de baixa severidade. Não filtre por importância ou confiança neste estágio - um passo de verificação separado fará isso. Seu objetivo aqui é cobertura: é melhor superficializar uma descoberta que depois é filtrada do que silenciosamente descartar um bug real. Para cada descoberta, inclua seu nível de confiança e uma severidade estimada para que um filtro downstream possa classificá-los.

Recomendamos iterar em prompts contra um subconjunto de suas avaliações ou casos de teste para validar ganhos de recall ou pontuação F1.

Uso de computador

Princípios gerais

Seja claro e direto

Pense em Claude como um funcionário brilhante mas novo que carece de contexto sobre suas normas e fluxos de trabalho. Quanto mais precisamente você explicar o que quer, melhor o resultado.

Regra de ouro: Mostre seu prompt para um colega com contexto mínimo sobre a tarefa e peça-lhe para segui-lo. Se eles ficariam confusos, Claude também ficará.

Seja específico sobre o formato de saída desejado e restrições.
Forneça instruções como etapas sequenciais usando listas numeradas ou pontos de bala quando a ordem ou completude das etapas importa.

Adicione contexto para melhorar o desempenho

Claude é inteligente o suficiente para generalizar a partir da explicação.

Use exemplos efetivamente

Ao adicionar exemplos, torne-os:

Relevantes: Espelhe seu caso de uso real de perto.
Diversos: Cubra casos extremos e variem o suficiente para que Claude não pegue padrões não intencionais.
Estruturados: Envolva exemplos em tags <example> (múltiplos exemplos em tags <examples>) para que Claude possa distingui-los de instruções.

Estruture prompts com tags XML

Melhores práticas:

Use nomes de tags consistentes e descritivos em seus prompts.
Aninhe tags quando o conteúdo tem uma hierarquia natural (documentos dentro de <documents>, cada um dentro de <document index="n">).

Dê ao Claude um papel

Definir um papel no prompt do sistema foca o comportamento e tom do Claude para seu caso de uso. Até uma única frase faz diferença:

Python

import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    system="You are a helpful coding assistant specializing in Python.",
    messages=[
        {"role": "user", "content": "How do I sort a list of dictionaries by key?"}
    ],
)
print(message.content)

Prompting de contexto longo

Ao trabalhar com documentos grandes ou entradas ricas em dados (20k+ tokens), estruture seu prompt cuidadosamente para obter os melhores resultados:

Coloque dados de longa forma no topo: Coloque seus documentos longos e entradas perto do topo de seu prompt, acima de sua consulta, instruções e exemplos. Isso pode melhorar significativamente o desempenho em todos os modelos.

Consultas no final podem melhorar a qualidade da resposta em até 30% em testes, especialmente com entradas complexas e multi-documento.
Estruture conteúdo de documento e metadados com tags XML: Ao usar múltiplos documentos, envolva cada documento em tags <document> com subtags <document_content> e <source> (e outros metadados) para clareza.
Fundamente respostas em citações: Para tarefas de documento longo, peça ao Claude para citar partes relevantes dos documentos primeiro antes de realizar sua tarefa. Isso ajuda Claude a cortar o ruído do resto do conteúdo do documento.

Autoconhecimento do modelo

Se você gostaria que Claude se identificasse corretamente em sua aplicação ou usasse strings de API específicas:

Exemplo de prompt para identidade do modelo

O assistente é Claude, criado pela Anthropic. O modelo atual é Claude Opus 4.7.

Para aplicativos alimentados por LLM que precisam especificar strings de modelo:

Exemplo de prompt para string de modelo

Quando um LLM é necessário, por favor padrão para Claude Opus 4.7 a menos que o usuário solicite de outra forma. A string de modelo exata para Claude Opus 4.7 é claude-opus-4-7.

Saída e formatação

Estilo de comunicação e verbosidade

Os modelos mais recentes do Claude têm um estilo de comunicação mais conciso e natural em comparação com modelos anteriores:

Mais direto e fundamentado: Fornece relatórios de progresso baseados em fatos em vez de atualizações auto-celebratórias
Mais conversacional: Ligeiramente mais fluente e coloquial, menos parecido com máquina
Menos verboso: Pode pular resumos verbais para eficiência a menos que solicitado de outra forma

Isso significa que Claude pode pular resumos verbais após chamadas de ferramentas, pulando diretamente para a próxima ação. Se você preferir mais visibilidade em seu raciocínio:

Exemplo de prompt

Após completar uma tarefa que envolve uso de ferramentas, forneça um resumo rápido do trabalho que você fez.

Controle o formato de respostas

Existem algumas formas particularmente eficazes de direcionar a formatação de saída:

Diga ao Claude o que fazer em vez do que não fazer
- Em vez de: "Não use markdown em sua resposta"
- Tente: "Sua resposta deve ser composta de parágrafos de prosa fluindo suavemente."
Use indicadores de formato XML
- Tente: "Escreva as seções de prosa de sua resposta em tags <smoothly_flowing_prose_paragraphs>."
Combine o estilo do seu prompt com a saída desejada

O estilo de formatação usado em seu prompt pode influenciar o estilo de resposta do Claude. Se você ainda está experimentando problemas de direcionabilidade com formatação de saída, tente combinar o estilo do seu prompt com o estilo de saída desejado o mais próximo possível. Por exemplo, remover markdown de seu prompt pode reduzir o volume de markdown na saída.
Use prompts detalhados para preferências de formatação específicas

Para mais controle sobre uso de markdown e formatação, forneça orientação explícita:

Exemplo de prompt para minimizar markdown

<avoid_excessive_markdown_and_bullet_points>
Ao escrever relatórios, documentos, explicações técnicas, análises ou qualquer conteúdo de longa forma, escreva em prosa clara e fluida usando parágrafos e frases completos. Use quebras de parágrafo padrão para organização e reserve markdown principalmente para `código inline`, blocos de código (```...```), e títulos simples (###, e ###). Evite usar **negrito** e *itálicos*.

NÃO use listas ordenadas (1. ...) ou listas não ordenadas (*) a menos que : a) você esteja apresentando itens verdadeiramente discretos onde um formato de lista é a melhor opção, ou b) o usuário explicitamente solicite uma lista ou ranking

Em vez de listar itens com bullets ou números, incorpore-os naturalmente em frases. Esta orientação se aplica especialmente à escrita técnica. Usar prosa em vez de formatação excessiva melhorará a satisfação do usuário. NUNCA produza uma série de pontos de bala excessivamente curtos.

Seu objetivo é texto legível e fluido que guie o leitor naturalmente através de ideias em vez de fragmentar informações em pontos isolados.
</avoid_excessive_markdown_and_bullet_points>

Saída LaTeX

Claude Opus 4.6 usa LaTeX como padrão para expressões matemáticas, equações e explicações técnicas. Se você preferir texto simples, adicione as seguintes instruções ao seu prompt:

Exemplo de prompt

Formate sua resposta em texto simples apenas. Não use LaTeX, MathJax ou qualquer notação de markup como \( \), $, ou \frac{}{}. Escreva todas as expressões matemáticas usando caracteres de texto padrão (por exemplo, "/" para divisão, "*" para multiplicação, e "^" para expoentes).

Criação de documentos

Para melhores resultados com criação de documentos:

Exemplo de prompt

Crie uma apresentação profissional sobre [tópico]. Inclua elementos de design reflexivos, hierarquia visual e animações envolventes onde apropriado.

Migrando de respostas pré-preenchidas

Aqui estão cenários comuns de prefill e como migrar para longe deles:

Uso de ferramentas

Para Claude tomar ação, seja mais explícito:

Para tornar Claude mais proativo em tomar ação por padrão, você pode adicionar isto ao seu prompt do sistema:

Exemplo de prompt para ação proativa

<default_to_action>
Por padrão, implemente mudanças em vez de apenas sugerir. Se a intenção do usuário é pouco clara, infira a ação provável mais útil e prossiga, usando ferramentas para descobrir qualquer detalhe faltante em vez de adivinhar. Tente inferir a intenção do usuário sobre se uma chamada de ferramenta (por exemplo, edição ou leitura de arquivo) é pretendida ou não, e aja de acordo.
</default_to_action>

Exemplo de prompt para ação conservadora

<do_not_act_before_instructions>
Não pule para implementação ou mude arquivos a menos que claramente instruído a fazer mudanças. Quando a intenção do usuário é ambígua, padrão para fornecer informações, fazer pesquisa e fornecer recomendações em vez de tomar ação. Apenas prossiga com edições, modificações ou implementações quando o usuário explicitamente solicitar.
</do_not_act_before_instructions>

Otimizar chamadas de ferramentas paralelas

Os modelos mais recentes do Claude se destacam na execução paralela de ferramentas. Esses modelos irão:

Executar múltiplas buscas especulativas durante pesquisa
Ler vários arquivos simultaneamente para construir contexto mais rapidamente
Executar comandos bash em paralelo (o que pode até criar gargalo no desempenho do sistema)

Exemplo de prompt para máxima eficiência paralela

<use_parallel_tool_calls>
Se você pretende chamar múltiplas ferramentas e não há dependências entre as chamadas de ferramentas, faça todas as chamadas de ferramentas independentes em paralelo. Priorize chamar ferramentas simultaneamente sempre que as ações puderem ser feitas em paralelo em vez de sequencialmente. Por exemplo, ao ler 3 arquivos, execute 3 chamadas de ferramentas em paralelo para ler todos os 3 arquivos no contexto ao mesmo tempo. Maximize o uso de chamadas de ferramentas paralelas sempre que possível para aumentar velocidade e eficiência. No entanto, se algumas chamadas de ferramentas dependem de chamadas anteriores para informar valores dependentes como os parâmetros, NÃO chame essas ferramentas em paralelo e em vez disso chame-as sequencialmente. Nunca use placeholders ou adivinhe parâmetros ausentes em chamadas de ferramentas.
</use_parallel_tool_calls>

Exemplo de prompt para reduzir execução paralela

Execute operações sequencialmente com breves pausas entre cada etapa para garantir estabilidade.

Pensamento e raciocínio

Excesso de pensamento e minuciosidade excessiva

Substitua padrões genéricos por instruções mais direcionadas. Em vez de "Padrão para usar [ferramenta]," adicione orientação como "Use [ferramenta] quando isso melhoraria sua compreensão do problema."
Remova excesso de prompting. Ferramentas que foram subtriggeradas em modelos anteriores provavelmente serão acionadas apropriadamente agora. Instruções como "Se em dúvida, use [ferramenta]" causarão overtriggering.
Use effort como fallback. Se Claude continuar sendo excessivamente agressivo, use uma configuração mais baixa para effort.

Exemplo de prompt

Quando você está decidindo como abordar um problema, escolha uma abordagem e comprometa-se com ela. Evite revisitar decisões a menos que encontre novas informações que contradizem diretamente seu raciocínio. Se você está pesando duas abordagens, escolha uma e leve-a adiante. Você sempre pode corrigir o curso depois se a abordagem escolhida falhar.

Aproveitar capacidades de pensamento e pensamento intercalado

Você pode guiar o comportamento de pensamento do Claude:

Exemplo de prompt

Após receber resultados de ferramentas, reflita cuidadosamente sobre sua qualidade e determine os próximos passos ideais antes de prosseguir. Use seu pensamento para planejar e iterar com base nessas novas informações, e então tome a melhor ação seguinte.

Exemplo de prompt

Pensamento estendido adiciona latência e deve ser usado apenas quando melhorará significativamente a qualidade da resposta - tipicamente para problemas que requerem raciocínio multi-etapa. Quando em dúvida, responda diretamente.

Se você está migrando de pensamento estendido com budget_tokens, substitua sua configuração de pensamento e mova o controle de budget para effort:

Antes (pensamento estendido, modelos mais antigos):

Python

client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=64000,
    thinking={"type": "enabled", "budget_tokens": 32000},
    messages=[{"role": "user", "content": "..."}],
)

Depois (pensamento adaptativo):

Python

client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},  # or "max", "xhigh", "medium", "low"
    messages=[{"role": "user", "content": "..."}],
)

Se você não está usando pensamento estendido, nenhuma mudança é necessária. Pensamento está desligado por padrão quando você omite o parâmetro thinking.

Prefira instruções gerais em vez de passos prescritivos. Um prompt como "pense minuciosamente" frequentemente produz melhor raciocínio do que um plano passo-a-passo escrito à mão. O raciocínio do Claude frequentemente excede o que um humano prescreveria.
Exemplos multishot funcionam com pensamento. Use tags <thinking> dentro de seus exemplos few-shot para mostrar ao Claude o padrão de raciocínio. Ele generalizará esse estilo para seus próprios blocos de pensamento estendido.
CoT manual como fallback. Quando pensamento está desligado, você ainda pode encorajar raciocínio passo-a-passo pedindo ao Claude para pensar através do problema. Use tags estruturadas como <thinking> e <answer> para separar claramente raciocínio da saída final.
Peça ao Claude para auto-verificar. Acrescente algo como "Antes de terminar, verifique sua resposta contra [critérios de teste]." Isso captura erros confiabilmente, especialmente para codificação e matemática.

Para mais informações sobre capacidades de pensamento, veja Pensamento estendido e Pensamento adaptativo.

Sistemas agentic

Raciocínio de longo horizonte e rastreamento de estado

Consciência de contexto e fluxos de trabalho multi-janela

Gerenciando limites de contexto:

Exemplo de prompt

Sua janela de contexto será automaticamente compactada conforme se aproxima de seu limite, permitindo que você continue trabalhando indefinidamente de onde parou. Portanto, não interrompa tarefas cedo devido a preocupações com orçamento de tokens. Conforme você se aproxima de seu limite de orçamento de tokens, salve seu progresso e estado atuais na memória antes da janela de contexto ser atualizada. Sempre seja o mais persistente e autônomo possível e complete tarefas totalmente, mesmo se o final de seu orçamento estiver se aproximando. Nunca interrompa artificialmente nenhuma tarefa cedo independentemente do contexto restante.

A ferramenta de memória se emparelha naturalmente com consciência de contexto para transições de contexto perfeitas.

Fluxos de trabalho multi-janela de contexto

Para tarefas abrangendo múltiplas janelas de contexto:

Use um prompt diferente para a primeira janela de contexto: Use a primeira janela de contexto para configurar um framework (escrever testes, criar scripts de setup), então use futuras janelas de contexto para iterar em uma lista de tarefas.
Tenha o modelo escrever testes em um formato estruturado: Peça ao Claude para criar testes antes de começar o trabalho e acompanhe-os em um formato estruturado (por exemplo, tests.json). Isso leva a melhor capacidade de longo prazo para iterar. Lembre Claude da importância dos testes: "É inaceitável remover ou editar testes porque isso pode levar a funcionalidade ausente ou bugada."
Configure ferramentas de qualidade de vida: Encoraje Claude a criar scripts de setup (por exemplo, init.sh) para iniciar graciosamente servidores, executar suites de testes e linters. Isso previne trabalho repetido ao continuar de uma janela de contexto fresca.
Começar do zero vs compactação: Quando uma janela de contexto é limpa, considere começar com uma janela de contexto completamente nova em vez de usar compactação. Os modelos mais recentes do Claude são extremamente eficazes em descobrir estado do sistema de arquivos local. Em alguns casos, você pode querer aproveitar isso em vez de compactação. Seja prescritivo sobre como deve começar:
- "Chame pwd; você pode apenas ler e escrever arquivos neste diretório."
- "Revise progress.txt, tests.json, e os logs do git."
- "Execute manualmente um teste de integração fundamental antes de prosseguir para implementar novas funcionalidades."
Forneça ferramentas de verificação: Conforme o comprimento de tarefas autônomas cresce, Claude precisa verificar correção sem feedback humano contínuo. Ferramentas como servidor Playwright MCP ou capacidades de uso de computador para testar UIs são úteis.
Encoraje uso completo de contexto: Solicite ao Claude para completar eficientemente componentes antes de prosseguir:

Exemplo de prompt

Esta é uma tarefa muito longa, então pode ser benéfico planejar seu trabalho claramente. É encorajado gastar todo seu contexto de saída trabalhando na tarefa - apenas certifique-se de que você não fica sem contexto com trabalho significativo não commitado. Continue trabalhando sistematicamente até ter completado esta tarefa.

Melhores práticas de gerenciamento de estado

Use formatos estruturados para dados de estado: Ao rastrear informações estruturadas (como resultados de testes ou status de tarefas), use JSON ou outros formatos estruturados para ajudar Claude a entender requisitos de schema
Use texto não estruturado para notas de progresso: Notas de progresso em forma livre funcionam bem para rastrear progresso geral e contexto
Use git para rastreamento de estado: Git fornece um log do que foi feito e checkpoints que podem ser restaurados. Os modelos mais recentes do Claude se saem especialmente bem usando git para rastrear estado em múltiplas sessões.
Enfatize progresso incremental: Peça explicitamente ao Claude para acompanhar seu progresso e focar em trabalho incremental

Equilibrando autonomia e segurança

Exemplo de prompt

Considere a reversibilidade e impacto potencial de suas ações. Você é encorajado a tomar ações locais e reversíveis como editar arquivos ou executar testes, mas para ações que são difíceis de reverter, afetam sistemas compartilhados, ou poderiam ser destrutivas, peça ao usuário antes de prosseguir.

Exemplos de ações que justificam confirmação:
- Operações destrutivas: deletar arquivos ou branches, dropar tabelas de banco de dados, rm -rf
- Operações difíceis de reverter: git push --force, git reset --hard, amending commits publicados
- Operações visíveis para outros: pushing código, comentando em PRs/issues, enviando mensagens, modificando infraestrutura compartilhada

Ao encontrar obstáculos, não use ações destrutivas como atalho. Por exemplo, não contorne verificações de segurança (por exemplo --no-verify) ou descarte arquivos desconhecidos que podem ser trabalho em progresso.

Pesquisa e coleta de informações

Forneça critérios de sucesso claros: Defina o que constitui uma resposta bem-sucedida para sua pergunta de pesquisa
Encoraje verificação de fonte: Peça ao Claude para verificar informações em múltiplas fontes
Para tarefas de pesquisa complexas, use uma abordagem estruturada:

Exemplo de prompt para pesquisa complexa

Procure por essa informação de forma estruturada. Conforme você coleta dados, desenvolva várias hipóteses concorrentes. Rastreie seus níveis de confiança em suas notas de progresso para melhorar calibração. Regularmente auto-critique sua abordagem e plano. Atualize um arquivo de árvore de hipóteses ou notas de pesquisa para persistir informação e fornecer transparência. Quebre essa tarefa de pesquisa complexa sistematicamente.

Essa abordagem estruturada permite que Claude encontre e sintetize virtualmente qualquer pedaço de informação e iterativamente critique seus achados, não importa o tamanho do corpus.

Orquestração de subagentes

Para aproveitar esse comportamento:

Garanta ferramentas de subagente bem-definidas: Tenha ferramentas de subagente disponíveis e descritas em definições de ferramentas
Deixe Claude orquestrar naturalmente: Claude delegará apropriadamente sem instrução explícita
Observe excesso de uso: Claude Opus 4.6 tem uma forte predileção por subagentes e pode gerá-los em situações onde uma abordagem mais simples e direta seria suficiente. Por exemplo, o modelo pode gerar subagentes para exploração de código quando uma chamada grep direta é mais rápida e suficiente.

Se você está vendo uso excessivo de subagentes, adicione orientação explícita sobre quando subagentes são e não são justificados:

Exemplo de prompt para uso de subagentes

Use subagentes quando tarefas podem rodar em paralelo, requerem contexto isolado, ou envolvem workstreams independentes que não precisam compartilhar estado. Para tarefas simples, operações sequenciais, edições de arquivo único, ou tarefas onde você precisa manter contexto entre passos, trabalhe diretamente em vez de delegar.

Encadear prompts complexos

Reduzir criação de arquivos em codificação agentic

Se você prefere minimizar criação de arquivo novo líquido, você pode instruir Claude a limpar após si mesmo:

Exemplo de prompt

Se você criar quaisquer arquivos novos temporários, scripts, ou arquivos auxiliares para iteração, limpe esses arquivos removendo-os ao final da tarefa.

Excesso de entusiasmo

Por exemplo:

Exemplo de prompt para minimizar overengineering

Evite over-engineering. Apenas faça mudanças que são diretamente solicitadas ou claramente necessárias. Mantenha soluções simples e focadas:

- Escopo: Não adicione funcionalidades, refatore código, ou faça "melhorias" além do que foi pedido. Uma correção de bug não precisa de código circundante limpo. Uma funcionalidade simples não precisa de configurabilidade extra.

- Documentação: Não adicione docstrings, comentários, ou anotações de tipo para código que você não mudou. Apenas adicione comentários onde a lógica não é auto-evidente.

- Codificação defensiva: Não adicione tratamento de erro, fallbacks, ou validação para cenários que não podem acontecer. Confie em código interno e garantias de framework. Apenas valide em limites de sistema (entrada de usuário, APIs externas).

- Abstrações: Não crie helpers, utilities, ou abstrações para operações únicas. Não projete para requisitos futuros hipotéticos. A quantidade certa de complexidade é o mínimo necessário para a tarefa atual.

Evitar focar em passar testes e hard-coding

Exemplo de prompt

Por favor escreva uma solução de alta qualidade e propósito geral usando as ferramentas padrão disponíveis. Não crie scripts auxiliares ou workarounds para realizar a tarefa mais eficientemente. Implemente uma solução que funcione corretamente para todas as entradas válidas, não apenas os casos de teste. Não hard-code valores ou crie soluções que funcionem apenas para entradas de teste específicas. Em vez disso, implemente a lógica real que resolve o problema generalmente.

Foque em entender os requisitos do problema e implementar o algoritmo correto. Testes estão lá para verificar correção, não para definir a solução. Forneça uma implementação principiada que segue melhores práticas e princípios de design de software.

Se a tarefa é irrazoável ou infactível, ou se qualquer um dos testes está incorreto, por favor me informe em vez de contorná-los. A solução deve ser robusta, mantível, e extensível.

Minimizando alucinações em codificação agentic

Exemplo de prompt

<investigate_before_answering>
Nunca especule sobre código que você não abriu. Se o usuário referencia um arquivo específico, você DEVE ler o arquivo antes de responder. Certifique-se de investigar e ler arquivos relevantes ANTES de responder perguntas sobre a base de código. Nunca faça nenhuma afirmação sobre código antes de investigar a menos que você tenha certeza da resposta correta - dê respostas fundamentadas e livres de alucinação.
</investigate_before_answering>

Dicas específicas de capacidade

Capacidades de visão melhoradas

Design de frontend

Para um guia detalhado sobre melhorar design de frontend, veja o post do blog sobre melhorando design de frontend através de skills.

Aqui está um trecho de prompt de sistema que você pode usar para encorajar melhor design de frontend:

Exemplo de prompt para estética de frontend

<frontend_aesthetics>
Você tende a convergir para saídas genéricas e "on distribution". Em design de frontend, isso cria o que usuários chamam de estética "AI slop". Evite isso: faça frontends criativos e distintivos que surpreendem e deliciam.

Foque em:
- Tipografia: Escolha fontes que são bonitas, únicas e interessantes. Evite fontes genéricas como Arial e Inter; opte em vez disso por escolhas distintivas que elevam a estética do frontend.
- Cor & Tema: Comprometa-se com uma estética coerente. Use variáveis CSS para consistência. Cores dominantes com acentos agudos superam paletas tímidas e uniformemente distribuídas. Desenhe de temas de IDE e estéticas culturais para inspiração.
- Movimento: Use animações para efeitos e micro-interações. Priorize soluções CSS-only para HTML. Use biblioteca Motion para React quando disponível. Foque em momentos de alto impacto: um carregamento de página bem orquestrado com reveals escalonados (animation-delay) cria mais deleite do que micro-interações espalhadas.
- Fundos: Crie atmosfera e profundidade em vez de padrão para cores sólidas. Camada gradientes CSS, use padrões geométricos, ou adicione efeitos contextuais que correspondem à estética geral.

Evite estéticas genéricas geradas por IA:
- Famílias de fontes overusadas (Inter, Roboto, Arial, fontes de sistema)
- Esquemas de cor clichê (particularmente gradientes roxos em fundos brancos)
- Layouts e padrões de componentes previsíveis
- Design cookie-cutter que carece de caráter específico do contexto

Interprete criativamente e faça escolhas inesperadas que se sentem genuinamente projetadas para o contexto. Varie entre temas claros e escuros, diferentes fontes, diferentes estéticas. Você ainda tende a convergir em escolhas comuns (Space Grotesk, por exemplo) entre gerações. Evite isso: é crítico que você pense fora da caixa!
</frontend_aesthetics>

Você também pode referir-se à definição de skill completa.

Considerações de migração

Ao migrar para modelos Claude 4.6 de gerações anteriores:

Seja específico sobre comportamento desejado: Considere descrever exatamente o que você gostaria de ver na saída.
Enquadre suas instruções com modificadores: Adicionar modificadores que encorajam Claude a aumentar a qualidade e detalhe de sua saída pode ajudar a moldar melhor o desempenho do Claude. Por exemplo, em vez de "Crie um dashboard de análise", use "Crie um dashboard de análise. Inclua o máximo de funcionalidades e interações relevantes possível. Vá além do básico para criar uma implementação totalmente funcional."
Solicite funcionalidades específicas explicitamente: Animações e elementos interativos devem ser solicitados explicitamente quando desejados.
Atualize configuração de pensamento: Modelos Claude 4.6 usam pensamento adaptativo (thinking: {type: "adaptive"}) em vez de pensamento manual com budget_tokens. Use o parâmetro effort para controlar profundidade de pensamento.
Migre de respostas pré-preenchidas: Respostas pré-preenchidas na última volta de assistente estão deprecadas começando com modelos Claude 4.6. Veja Migrando de respostas pré-preenchidas para orientação detalhada sobre alternativas.
Ajuste prompting anti-preguiça: Se seus prompts anteriormente encorajavam o modelo a ser mais minucioso ou usar ferramentas mais agressivamente, reduza essa orientação. Modelos Claude 4.6 são significativamente mais proativos e podem overtrigger em instruções que eram necessárias para modelos anteriores.

Para passos de migração detalhados, veja o Guia de migração.

Migrando de Claude Sonnet 4.5 para Claude Sonnet 4.6

Configurações de effort recomendadas:

Medium para a maioria das aplicações
Low para cargas de trabalho de alto volume ou sensíveis a latência
Defina um grande orçamento de token de saída máxima (64k tokens recomendado) em medium ou high effort para dar ao modelo espaço para pensar e agir

Se você não está usando pensamento estendido

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "disabled"},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Se você está usando pensamento estendido

Migrando para pensamento adaptativo

Pensamento adaptativo é particularmente bem adequado aos seguintes padrões de carga de trabalho:

Agentes multi-etapa autônomos: agentes de codificação que transformam requisitos em software funcional, pipelines de análise de dados, e busca de bugs onde o modelo roda independentemente em muitos passos. Pensamento adaptativo permite que o modelo calibre seu raciocínio por passo, mantendo-se no caminho em trajetórias mais longas. Para essas cargas de trabalho, comece em high effort. Se latência ou uso de token for uma preocupação, escale para medium.
Agentes de uso de computador: Claude Sonnet 4.6 alcançou melhor acurácia em classe em avaliações de uso de computador usando modo adaptativo.
Cargas de trabalho bimodais: uma mistura de tarefas fáceis e difíceis onde adaptativo pula pensamento em consultas simples e raciocina profundamente em complexas.

Ao usar pensamento adaptativo, avalie medium e high effort em suas tarefas. O nível certo depende do tradeoff de sua carga de trabalho entre qualidade, latência e uso de token.

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=64000,
    thinking={"type": "adaptive"},
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "..."}],
)

Mantendo budget_tokens durante migração

Para casos de uso de codificação (codificação agentic, fluxos de trabalho pesados em ferramentas, geração de código), comece com medium effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16384,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "..."}],
)

Para casos de uso de chat e não-codificação (chat, geração de conteúdo, busca, classificação), comece com low effort:

Python

client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=8192,
    thinking={"type": "enabled", "budget_tokens": 16384},
    output_config={"effort": "low"},
    messages=[{"role": "user", "content": "..."}],
)

Was this page helpful?

Prompting Claude Opus 4.7

Comprimento da resposta e verbosidade

Calibrando esforço e profundidade de pensamento

Acionamento de uso de ferramentas

Atualizações de progresso voltadas para o usuário

Seguimento de instruções mais literal

Tom e estilo de escrita

Controlando geração de subagentes

Padrões de design e frontend

Produtos de codificação interativa

Arneses de revisão de código

Uso de computador

Princípios gerais

Seja claro e direto

Exemplo: Criando um dashboard de análise

Adicione contexto para melhorar o desempenho

Exemplo: Preferências de formatação

Use exemplos efetivamente

Estruture prompts com tags XML

Dê ao Claude um papel

Prompting de contexto longo

Exemplo de estrutura multi-documento

Exemplo de extração de citação

Autoconhecimento do modelo

Saída e formatação

Estilo de comunicação e verbosidade

Controle o formato de respostas

Saída LaTeX

Criação de documentos

Migrando de respostas pré-preenchidas

Controlando formatação de saída

Eliminando preâmbulos

Evitando recusas ruins

Continuações

Hidratação de contexto e consistência de papel

Uso de ferramentas

Uso de ferramentas

Exemplo: Instruções explícitas

Otimizar chamadas de ferramentas paralelas

Pensamento e raciocínio

Excesso de pensamento e minuciosidade excessiva

Aproveitar capacidades de pensamento e pensamento intercalado

Sistemas agentic

Raciocínio de longo horizonte e rastreamento de estado

Consciência de contexto e fluxos de trabalho multi-janela

Fluxos de trabalho multi-janela de contexto

Melhores práticas de gerenciamento de estado

Exemplo: Rastreamento de estado

Equilibrando autonomia e segurança

Pesquisa e coleta de informações

Orquestração de subagentes

Encadear prompts complexos

Reduzir criação de arquivos em codificação agentic

Excesso de entusiasmo

Evitar focar em passar testes e hard-coding

Minimizando alucinações em codificação agentic

Dicas específicas de capacidade

Capacidades de visão melhoradas

Design de frontend

Considerações de migração

Migrando de Claude Sonnet 4.5 para Claude Sonnet 4.6

Se você não está usando pensamento estendido

Se você está usando pensamento estendido

Migrando para pensamento adaptativo

Mantendo budget_tokens durante migração

Prompting Claude Opus 4.7

Comprimento da resposta e verbosidade

Calibrando esforço e profundidade de pensamento

Acionamento de uso de ferramentas

Atualizações de progresso voltadas para o usuário

Seguimento de instruções mais literal

Tom e estilo de escrita

Controlando geração de subagentes

Padrões de design e frontend

Produtos de codificação interativa

Arneses de revisão de código

Uso de computador

Princípios gerais

Seja claro e direto

Exemplo: Criando um dashboard de análise