• Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Casos de uso
Visão geralRoteamento de ticketsAgente de suporte ao clienteModeração de conteúdoResumo jurídico
Engenharia de prompts
Visão geralPráticas recomendadas de promptsPrompts para o Claude Fable 5Prompts para o Claude Opus 4.8Ferramentas de prompts do Console
Testar e avaliar
Definir sucesso e criar avaliaçõesUsando a Ferramenta de Avaliação no ConsoleReduzindo a latência
Fortalecer proteções
Reduzir alucinaçõesAumentar a consistência da saídaMitigar jailbreaksReduzir vazamento de prompt
Referência
Glossário

Log in
Prompts para o Claude Opus 4.8
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Práticas recomendadas/Engenharia de prompts

Prompting para Claude Opus 4.8

Diferenças comportamentais e padrões de prompting para Claude Opus 4.8, abrangendo verbosidade, calibração de esforço, uso de ferramentas, subagentes e padrões de frontend.

Este guia aborda os padrões de prompting específicos do Claude Opus 4.8. Para conhecer as capacidades do modelo e as mudanças na API, consulte Novidades no Claude Opus 4.8. Para técnicas que se aplicam a todos os modelos Claude atuais, consulte Melhores práticas de prompting.

O Claude Opus 4.8 tem pontos fortes particulares em trabalho agêntico de longo horizonte, trabalho de conhecimento, visão e tarefas de memória. Ele tem bom desempenho imediato com prompts existentes do Claude Opus 4.7. Os padrões abaixo cobrem os comportamentos que mais frequentemente exigem ajustes.



Para mudanças de parâmetros da API ao migrar do Claude Opus 4.7 (parâmetros de amostragem, padrão de esforço, janela de contexto padrão de 1M (200k no Microsoft Foundry), mensagens de sistema no meio da conversa e detalhes de parada por recusa), consulte o guia de migração.

Comprimento da resposta e verbosidade

O Claude Opus 4.8 calibra o comprimento da resposta de acordo com a complexidade que julga que a tarefa tem, em vez de adotar uma verbosidade fixa por padrão. Isso geralmente significa respostas mais curtas em consultas simples e muito mais longas em análises abertas.

Se o seu produto depende de um determinado estilo ou verbosidade de saída, talvez seja necessário ajustar seus prompts. Como exemplo, para diminuir a verbosidade, você pode adicionar:

Provide concise, focused responses. Skip non-essential context, and keep examples minimal.

Se você observar exemplos específicos de tipos de verbosidade (como explicações excessivas), pode adicionar instruções adicionais no seu prompt para evitá-los. Exemplos positivos mostrando como o Claude pode se comunicar com o nível apropriado de concisão tendem a ser mais eficazes do que exemplos negativos ou instruções que dizem ao modelo o que não fazer.

Calibrando esforço e profundidade de pensamento

O parâmetro de esforço permite ajustar a inteligência do Claude em relação ao gasto de tokens, trocando capacidade por maior velocidade e custos mais baixos. Comece com o nível de esforço xhigh para casos de uso de codificação e agênticos, e use no mínimo o esforço high para a maioria dos casos de uso sensíveis à inteligência. Experimente outros níveis de esforço para ajustar ainda mais o uso de tokens e a inteligência:

  • max: O esforço máximo pode proporcionar ganhos de desempenho em alguns casos de uso, mas pode apresentar retornos decrescentes com o aumento do uso de tokens. Essa configuração também pode, às vezes, ser propensa a pensar demais. Teste o esforço máximo para tarefas que exigem muita inteligência.
  • xhigh: O esforço extra alto é a melhor configuração para a maioria dos casos de uso de codificação e agênticos.
  • high: Essa configuração equilibra o uso de tokens e a inteligência. Para a maioria dos casos de uso sensíveis à inteligência, use no mínimo o esforço high.
  • medium: Bom para casos de uso sensíveis a custo que precisam reduzir o uso de tokens em troca de inteligência.
  • low: Reserve para tarefas curtas e bem delimitadas e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.

O Claude Opus 4.8 respeita os níveis de esforço de forma estrita, especialmente nos níveis mais baixos. Em low e medium, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além. Isso é bom para latência e custo, mas em tarefas moderadamente complexas executadas com esforço low há algum risco de raciocínio insuficiente.

Se você observar raciocínio superficial em problemas complexos, aumente o esforço para high ou xhigh em vez de contornar isso via prompting. Se precisar manter o esforço em low por questões de latência, adicione orientação direcionada:

This task involves multi-step reasoning. Think carefully through the problem before responding.

O esforço provavelmente será mais importante para este modelo do que para qualquer Opus anterior, então experimente ativamente com ele ao fazer o upgrade.

No Claude Opus 4.8, o pensamento está desativado a menos que você defina explicitamente thinking: {type: "adaptive"}. O comportamento de acionamento do pensamento adaptativo é direcionável. Se você perceber que o modelo está pensando com mais frequência do que gostaria, o que pode acontecer com prompts do sistema grandes ou complexos, adicione orientação para direcioná-lo. Como sempre, meça o efeito de quaisquer mudanças de prompting no desempenho. Exemplo:

Thinking adds latency and should only be used when it will meaningfully improve answer
quality — typically for problems that require multi-step reasoning. When in doubt,
respond directly.

Por outro lado, se você estiver executando cargas de trabalho difíceis em medium e observando raciocínio insuficiente, a primeira alavanca é aumentar o esforço. Se precisar de controle mais fino, solicite isso diretamente no prompt.



Se você estiver executando o Claude Opus 4.8 com esforço max ou xhigh, defina um orçamento grande de tokens máximos de saída para que o modelo tenha espaço para pensar e agir em seus subagentes e chamadas de ferramentas. Comece com 64k tokens e ajuste a partir daí.

Acionamento do uso de ferramentas

O Claude Opus 4.8 tem uma tendência a favorecer o raciocínio em vez de chamadas de ferramentas. Isso produz melhores resultados na maioria dos casos. No entanto, aumentar a configuração de esforço é uma alavanca útil para aumentar o nível de uso de ferramentas, especialmente em trabalho de conhecimento. As configurações de esforço high ou xhigh mostram substancialmente mais uso de ferramentas em busca agêntica e codificação. Para cenários em que você deseja mais uso de ferramentas, também pode ajustar seu prompt para instruir explicitamente o modelo sobre quando e como usar adequadamente suas ferramentas. Por exemplo, se você perceber que o modelo não está usando suas ferramentas de busca na web, descreva claramente por que e como ele deve usá-las.

Atualizações de progresso voltadas ao usuário

O Claude Opus 4.8 fornece atualizações mais regulares e de maior qualidade ao usuário ao longo de traces agênticos longos. Se você adicionou scaffolding para forçar mensagens de status intermediárias ("Após cada 3 chamadas de ferramentas, resuma o progresso"), tente removê-lo. Se você perceber que o comprimento ou o conteúdo das atualizações voltadas ao usuário do Claude Opus 4.8 não estão bem calibrados para o seu caso de uso, descreva explicitamente como essas atualizações devem ser no prompt e forneça exemplos.

Seguimento de instruções mais literal

O Claude Opus 4.8 interpreta prompts de forma literal e explícita, particularmente em níveis de esforço mais baixos. Ele não generaliza silenciosamente uma instrução de um item para outro e não infere solicitações que você não fez. A vantagem desse literalismo é precisão e menos retrabalho, e geralmente tem melhor desempenho para casos de uso da API com prompts cuidadosamente ajustados, extração estruturada e pipelines onde você deseja comportamento previsível. Se você precisar que o Claude aplique uma instrução de forma ampla, declare o escopo explicitamente (por exemplo, "Aplique esta formatação a todas as seções, não apenas à primeira").

Tom e estilo de escrita

Como acontece com qualquer novo modelo, o estilo de prosa em textos longos pode mudar. O Claude Opus 4.8 tende a um estilo direto e opinativo, com fraseado mínimo voltado à validação e uso moderado de emojis. Se o seu produto depende de uma voz específica, reavalie os prompts de estilo em relação à nova linha de base.

Por exemplo, se a voz do seu produto for mais calorosa ou conversacional, adicione:

Use a warm, collaborative tone. Acknowledge the user's framing before answering.

Controlando a criação de subagentes

O Claude Opus 4.8 tende a criar menos subagentes por padrão. No entanto, esse comportamento é direcionável por meio de prompting; dê ao Claude Opus 4.8 orientação explícita sobre quando subagentes são desejáveis. Um exemplo ilustrativo para um caso de uso de codificação:

Do not spawn a subagent for work you can complete directly in a single response (e.g.
refactoring a function you can already see).

Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.

Padrões de design e frontend

O Claude Opus 4.8 tem fortes instintos de design, com um estilo padrão consistente: fundos em creme/off-white quente (~#F4F1EA), tipografia de exibição serifada (Georgia, Fraunces, Playfair), destaques de palavras em itálico e um acento terracota/âmbar. Isso funciona bem para briefings editoriais, de hospitalidade e de portfólio, mas parecerá deslocado para dashboards, ferramentas de desenvolvimento, fintech, saúde ou aplicativos corporativos. O padrão aparece tanto em apresentações de slides quanto em interfaces web.

Esse padrão é persistente. Instruções genéricas ("não use creme", "deixe limpo e minimalista") tendem a fazer o modelo mudar para uma paleta fixa diferente em vez de produzir variedade. Duas abordagens funcionam de forma confiável:

1. Especifique uma alternativa concreta. O modelo segue especificações explícitas com precisão:

Design a desktop landing page for a supplement brand called AEFRM.

The visual direction should come from a cold monochrome atmosphere using pale
silver-gray tones that gradually deepen into blue-gray and near-black, similar to a
misted metallic surface.

The page should feel sharp and controlled, with a strong sense of structure and restraint.

Use this tonal system across the full page instead of introducing bright accent colors.

Use the uploaded image on the hero design in black and white.

The layout should be built with clear horizontal sections and a centered max-width
container. Use 4px corner radius consistently across cards, buttons, inputs, and media
frames. Margins should feel generous, with enough empty space around each section so the
page breathes.

Typography should use a square, angular sans-serif with wider letter spacing than usual,
especially in headings and navigation, so the text feels more engineered and less
compressed. Headline text can be large and uppercase, while supporting copy remains
short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny
little texts on corners bottom centre like that.

For the structure, start with a hero section containing a strong product statement, one
short supporting paragraph, and a clean product placeholder or packshot frame. Below
that, add a benefit grid with three or four blocks, then a formulation or ingredients
section, and finally a cta.

Buttons should be flat and precise, with subtle hover changes using transition: all
160ms ease out where brightness and border contrast shift slightly rather than using
dramatic motion.

Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.

2. Faça o modelo propor opções antes de construir. Isso quebra o padrão e dá controle aos usuários. Se você anteriormente dependia de temperature para variedade de design, use esta abordagem; ela produz direções significativamente diferentes entre execuções. Exemplo de prompt:

Before building, propose 4 distinct visual directions tailored to this brief (each as:
bg hex / accent hex / typeface — one-line rationale). Ask the user to pick one, then
implement only that direction.

Além disso, o Claude Opus 4.8 requer menos prompting de design de frontend do que modelos anteriores para evitar padrões genéricos que os usuários chamam de estética "AI slop". Com modelos anteriores, a Anthropic recomendava um trecho de prompt mais longo na skill frontend-design. No entanto, o Claude Opus 4.8 gera frontends distintos e criativos com orientação de prompting mais mínima. Este trecho de prompt funciona bem com as orientações de prompting acima para variedade:

<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto,
Arial, system fonts), cliched color schemes (particularly purple gradients on white or
dark backgrounds), predictable layouts and component patterns, and cookie-cutter design
that lacks context-specific character. Use unique fonts, cohesive colors and themes, and
animations for effects and micro-interactions.
</frontend_aesthetics>

Produtos de codificação interativos

O uso de tokens e o comportamento do Claude Opus 4.8 podem diferir entre agentes de codificação autônomos e assíncronos com um único turno do usuário e agentes de codificação interativos e síncronos com múltiplos turnos do usuário. Especificamente, ele tende a usar mais tokens em configurações interativas, principalmente porque raciocina mais após os turnos do usuário. Isso pode melhorar a coerência de longo horizonte, o seguimento de instruções e as capacidades de codificação em sessões de codificação longas e interativas, mas também vem com mais uso de tokens. Para maximizar tanto o desempenho quanto a eficiência de tokens em produtos de codificação, use esforço xhigh ou high, adicione recursos autônomos como um modo automático e reduza o número de interações humanas exigidas dos seus usuários.

Naturalmente, ao limitar o número de interações do usuário necessárias, é importante especificar a tarefa, a intenção e as restrições relevantes antecipadamente no primeiro turno humano. Fornecer descrições de tarefas bem especificadas, claras e precisas antecipadamente pode ajudar a maximizar a autonomia e a inteligência, minimizando o uso extra de tokens após os turnos do usuário. Como o Claude Opus 4.8 é mais autônomo do que modelos anteriores, esse padrão de uso ajuda a maximizar o desempenho. Em contraste, prompts ambíguos ou subespecificados transmitidos progressivamente ao longo de múltiplos turnos do usuário tendem a reduzir relativamente a eficiência de tokens e, às vezes, o desempenho.

Harnesses de revisão de código

O Claude Opus 4.8 é significativamente melhor em encontrar bugs do que modelos anteriores, e tem tanto maior "recall" (revocação) quanto precisão em avaliações internas. No entanto, se o seu harness de revisão de código foi ajustado para um modelo anterior, você pode inicialmente observar menor recall. Isso provavelmente é um efeito do harness, não uma regressão de capacidade. Quando um prompt de revisão diz coisas como "relate apenas problemas de alta severidade", "seja conservador" ou "não seja detalhista", o Claude Opus 4.8 pode seguir essa instrução mais fielmente do que modelos anteriores: ele pode investigar o código com a mesma profundidade, identificar os bugs e então não relatar descobertas que julga estarem abaixo do limite que você estabeleceu. Isso pode se manifestar como o modelo fazendo a mesma profundidade de investigação, mas convertendo menos investigações em descobertas relatadas, especialmente em bugs de menor severidade. A precisão normalmente aumenta, mas o recall medido pode cair mesmo que a capacidade subjacente do modelo de encontrar bugs tenha melhorado.

Algumas sugestões de linguagem para o prompt:

Report every issue you find, including ones you are uncertain about or consider
low-severity. Do not filter for importance or confidence at this stage - a separate
verification step will do that. Your goal here is coverage: it is better to surface a
finding that later gets filtered out than to silently drop a real bug. For each finding,
include your confidence level and an estimated severity so a downstream filter can rank
them.

Este prompt pode ser usado sem ter uma segunda etapa real, mas mover a filtragem por confiança para fora da etapa de descoberta geralmente ajuda. Se o seu harness tiver uma etapa separada de verificação, deduplicação ou classificação, diga explicitamente ao modelo que seu trabalho na etapa de descoberta é cobertura, e não filtragem.

Se você quiser que o modelo faça autofiltragem em uma única passagem, seja concreto sobre onde está o limite em vez de usar termos qualitativos como "importante": por exemplo, "relate quaisquer bugs que possam causar comportamento incorreto, falha em teste ou resultado enganoso; omita apenas detalhes menores como preferências puramente de estilo ou nomenclatura."

Itere nos prompts usando um subconjunto das suas avaliações ou casos de teste para validar ganhos de recall ou de F1 score.

Uso de computador

A capacidade de uso de computador funciona em várias resoluções, até uma resolução máxima de 2576px / 3,75MP. Testes internos de uso de computador mostram que enviar imagens em 1080p oferece um bom equilíbrio entre desempenho e custo.

Para cargas de trabalho particularmente sensíveis a custo, 720p ou 1366×768 são opções de menor custo com forte desempenho. Realize seus próprios testes para encontrar as configurações ideais para o seu caso de uso; experimentar com configurações de esforço também pode ajudar a ajustar o comportamento do modelo.

Was this page helpful?

  • Comprimento da resposta e verbosidade
  • Calibrando esforço e profundidade de pensamento
  • Acionamento do uso de ferramentas
  • Atualizações de progresso voltadas ao usuário
  • Seguimento de instruções mais literal
  • Tom e estilo de escrita
  • Controlando a criação de subagentes
  • Padrões de design e frontend
  • Produtos de codificação interativos
  • Harnesses de revisão de código
  • Uso de computador