Este guia aborda os padrões de prompting específicos do Claude Sonnet 5. Para conhecer as capacidades do modelo e as mudanças na API, consulte Novidades no Claude Sonnet 5. Para técnicas que se aplicam a todos os modelos Claude atuais, consulte Melhores práticas de prompting.
O Claude Sonnet 5 tem pontos fortes específicos em tarefas de programação e agênticas. Ele tem bom desempenho imediato com prompts existentes do Claude Sonnet 4.6. Os padrões neste guia abordam os comportamentos que mais frequentemente exigem ajustes.
Para mudanças nos parâmetros da API ao migrar do Claude Sonnet 4.6 (pensamento adaptativo ativado por padrão, parâmetros de amostragem não aceitos, pensamento estendido manual removido e o novo tokenizador), consulte o guia de migração.
O Claude Sonnet 5 calibra o tamanho da resposta de acordo com a complexidade da tarefa, em vez de adotar uma verbosidade fixa por padrão. Isso geralmente significa respostas mais curtas em consultas simples e mais longas em análises abertas.
Se o seu produto depende de um determinado estilo ou verbosidade de saída, pode ser necessário ajustar seus prompts. Por exemplo, para diminuir a verbosidade, você pode adicionar:
Provide concise, focused responses. Skip non-essential context, and keep examples minimal.Se você observar tipos específicos de verbosidade (como explicações excessivas), pode adicionar instruções adicionais no seu prompt para evitá-los. Exemplos positivos mostrando como o Claude pode se comunicar com o nível apropriado de concisão tendem a ser mais eficazes do que exemplos negativos ou instruções que dizem ao modelo o que não fazer.
O parâmetro effort (esforço) permite ajustar a inteligência do Claude em relação ao gasto de tokens, trocando capacidade por maior velocidade e custos mais baixos. No Claude Sonnet 5, o effort tem como padrão high, o mesmo que no Claude Sonnet 4.6. Para as tarefas de programação e agênticas mais difíceis, aumente o effort para xhigh. Experimente outros níveis de effort para ajustar ainda mais o uso de tokens e a inteligência:
max: Capacidade máxima absoluta, sem restrições no gasto de tokens.xhigh: Esforço extra alto é a configuração recomendada para os casos de uso mais difíceis de programação e agênticos.high: O padrão. Esta configuração equilibra o uso de tokens e a inteligência para a maioria dos casos de uso.medium: Bom para casos de uso sensíveis a custo que precisam reduzir o uso de tokens em troca de inteligência.low: Reserve para tarefas curtas e bem delimitadas e cargas de trabalho sensíveis à latência que não são sensíveis à inteligência.Como um mapeamento aproximado entre modelos ao migrar: o Claude Sonnet 5 em medium é comparável em inteligência ao Claude Sonnet 4.6 em high, e o Claude Sonnet 5 em high é comparável ao Claude Sonnet 4.6 em max. Ao fazer benchmarking, faça a correspondência pelo comprimento de pensamento observado, e não pelo nome do nível de effort.
O Claude Sonnet 5 respeita os níveis de effort rigorosamente, especialmente nos níveis mais baixos. Em low e medium, o modelo limita seu trabalho ao que foi solicitado, em vez de ir além. Isso é bom para latência e custo, mas em tarefas moderadamente complexas executadas com effort low há algum risco de pensamento insuficiente.
Se você observar raciocínio superficial em problemas complexos, aumente o effort para high ou xhigh em vez de contornar isso via prompt. Se precisar manter o effort em low por questões de latência, adicione orientação direcionada:
This task involves multi-step reasoning. Think carefully through the problem before responding.No Claude Sonnet 5, o adaptive thinking (pensamento adaptativo) está ativado por padrão. Requisições sem um campo thinking são executadas com pensamento adaptativo. Isso é uma mudança em relação ao Claude Sonnet 4.6, em que as mesmas requisições eram executadas sem pensamento. Para desativar o pensamento completamente, passe thinking: {type: "disabled"}. Como max_tokens é um limite rígido para a saída total (pensamento mais texto de resposta), revise-o para cargas de trabalho que eram executadas sem pensamento no Claude Sonnet 4.6. Se você estava usando pensamento desativado com o Claude Sonnet 4.6, experimente pensamento ativado com níveis de effort mais baixos no Claude Sonnet 5.
O comportamento de acionamento do pensamento adaptativo é direcionável. Se você perceber que o modelo está emitindo blocos de pensamento com mais frequência do que gostaria, o que pode acontecer com prompts do sistema grandes ou complexos, adicione orientação para direcioná-lo. Como sempre, meça o efeito de quaisquer mudanças de prompting no desempenho. Exemplo:
Thinking adds latency and should only be used when it will meaningfully improve answer quality, typically for problems that require multi-step reasoning. When in doubt, respond directly.Por outro lado, se você estiver executando cargas de trabalho difíceis em medium e observando pensamento insuficiente, a primeira alavanca é aumentar o effort. Se precisar de controle mais fino, solicite isso diretamente no prompt.
O pensamento estendido manual (thinking: {type: "enabled", budget_tokens: N}) não é suportado no Claude Sonnet 5 e retorna um erro 400. Ele foi descontinuado no Claude Sonnet 4.6 e agora foi removido. Use pensamento adaptativo com o parâmetro effort em vez disso.
Se você estiver executando o Claude Sonnet 5 com effort high, xhigh ou max, deixe margem em max_tokens para que o modelo tenha espaço para pensamento e chamadas de ferramentas. Em tarefas longas, o pensamento adaptativo pode usar uma grande parte do orçamento; se o orçamento for apertado, você pode ver uma resposta que é quase inteiramente pensamento seguida de uma resposta truncada e stop_reason: "max_tokens". Aumentar max_tokens ou reduzir para effort medium resolve isso. Como o Claude Sonnet 5 usa um novo tokenizador que produz aproximadamente 30% mais tokens para o mesmo texto, limites de max_tokens ajustados para o Claude Sonnet 4.6 podem truncar saídas equivalentes.
O Claude Sonnet 5 é mais agêntico que o Claude Sonnet 4.6 por padrão e recorrerá a ferramentas e executará loops de autoverificação com mais facilidade. Com o pensamento desativado, o modelo tem menos probabilidade de recorrer a ferramentas ou considerar fazer buscas; se você depende de chamadas de ferramentas com pensamento desativado, adicione um incentivo explícito no prompt do sistema. O effort também é uma alavanca para o uso de ferramentas: configurações de effort high ou xhigh mostram substancialmente mais uso de ferramentas em busca agêntica e programação. Para cenários em que você deseja mais uso de ferramentas, também pode ajustar seu prompt para instruir explicitamente o modelo sobre quando e como usar adequadamente suas ferramentas. Por exemplo, se você perceber que o modelo não está usando suas ferramentas de busca na web, descreva claramente por que e como ele deve usá-las.
O Claude Sonnet 5 fornece atualizações regulares e de maior qualidade ao usuário ao longo de traces agênticos longos. Se você adicionou estruturas para forçar mensagens de status intermediárias ("Após cada 3 chamadas de ferramentas, resuma o progresso"), experimente removê-las. Se você perceber que o tamanho ou o conteúdo das atualizações voltadas ao usuário do Claude Sonnet 5 não estão bem calibrados para o seu caso de uso, descreva explicitamente como essas atualizações devem ser no prompt e forneça exemplos.
O Claude Sonnet 5 interpreta prompts de forma literal e explícita, particularmente em níveis de effort mais baixos. Ele não generaliza silenciosamente uma instrução de um item para outro e não infere solicitações que você não fez. A vantagem desse literalismo é a precisão, e ele geralmente tem melhor desempenho para casos de uso de API com prompts cuidadosamente ajustados, extração estruturada e pipelines em que você deseja comportamento previsível. Se você precisa que o Claude aplique uma instrução de forma ampla, declare o escopo explicitamente (por exemplo, "Aplique esta formatação a todas as seções, não apenas à primeira").
Como em qualquer novo modelo, o estilo de prosa em textos longos pode mudar. Se o seu produto depende de uma voz específica, reavalie os prompts de estilo em relação à nova linha de base.
Por exemplo, se a voz do seu produto é mais calorosa ou conversacional, adicione:
Use a warm, collaborative tone. Acknowledge the user's framing before answering.Se você anteriormente dependia de temperature para variedade estilística, observe que definir temperature, top_p ou top_k para um valor não padrão retorna um erro 400 no Claude Sonnet 5. Essa restrição é nova para modelos da classe Sonnet. Remova esses parâmetros ao migrar e use instruções no prompt do sistema para orientar tom e variedade.
O Claude Sonnet 5 pode adotar um estilo visual padrão consistente em briefings abertos de frontend e design. Um estilo padrão da casa pode funcionar bem para alguns briefings, mas parecer inadequado para dashboards, ferramentas de desenvolvimento, fintech, saúde ou aplicativos corporativos.
Instruções genéricas ("não use essa cor", "deixe limpo e minimalista") tendem a mudar o modelo para uma paleta fixa diferente, em vez de produzir variedade. Duas abordagens funcionam de forma confiável:
1. Especifique uma alternativa concreta. O modelo segue especificações explícitas com precisão:
Design a desktop landing page for a supplement brand called AEFRM.
The visual direction should come from a cold monochrome atmosphere using pale silver-gray tones that gradually deepen into blue-gray and near-black, similar to a misted metallic surface.
The page should feel sharp and controlled, with a strong sense of structure and restraint.
Use this tonal system across the full page instead of introducing bright accent colors.
Use the uploaded image on the hero design in black and white.
The layout should be built with clear horizontal sections and a centered max-width container. Use 4px corner radius consistently across cards, buttons, inputs, and media frames. Margins should feel generous, with enough empty space around each section so the page breathes.
Typography should use a square, angular sans-serif with wider letter spacing than usual, especially in headings and navigation, so the text feels more engineered and less compressed. Headline text can be large and uppercase, while supporting copy remains short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny little texts on corners bottom centre like that.
For the structure, start with a hero section containing a strong product statement, one short supporting paragraph, and a clean product placeholder or packshot frame. Below that, add a benefit grid with three or four blocks, then a formulation or ingredients section, and finally a cta.
Buttons should be flat and precise, with subtle hover changes using transition: all 160ms ease out where brightness and border contrast shift slightly rather than using dramatic motion.
Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Faça o modelo propor opções antes de construir. Isso quebra o padrão e dá controle aos usuários. Como temperature não é aceito no Claude Sonnet 5, essa abordagem é a forma recomendada de produzir direções de design significativamente diferentes entre execuções. Exemplo de prompt:
Before building, propose 4 distinct visual directions tailored to this brief (each as: bg hex / accent hex / typeface, plus a one-line rationale). Ask the user to pick one, then implement only that direction.Para evitar padrões genéricos que os usuários chamam de estética "AI slop", você pode incluir uma diretiva curta no seu prompt do sistema. A skill frontend-design fornece um tratamento mais completo, mas este trecho funciona bem junto com as abordagens de variedade anteriores:
<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto, Arial, system fonts), cliched color schemes (particularly purple gradients on white or dark backgrounds), predictable layouts and component patterns, and cookie-cutter design that lacks context-specific character. Use unique fonts, cohesive colors and themes, and animations for effects and micro-interactions.
</frontend_aesthetics>O uso de tokens e o comportamento podem diferir entre agentes de programação autônomos e assíncronos com um único turno de usuário e agentes de programação interativos e síncronos com múltiplos turnos de usuário. Para maximizar tanto o desempenho quanto a eficiência de tokens em produtos de programação, use effort xhigh ou high, adicione recursos autônomos como um modo automático e reduza o número de interações humanas exigidas dos seus usuários.
Ao limitar o número de interações de usuário necessárias, é importante especificar a tarefa, a intenção e as restrições relevantes antecipadamente no primeiro turno humano. Fornecer descrições de tarefas bem especificadas, claras e precisas antecipadamente pode ajudar a maximizar a autonomia e a inteligência, minimizando o uso extra de tokens após os turnos do usuário. Em contraste, prompts ambíguos ou subespecificados transmitidos progressivamente ao longo de múltiplos turnos de usuário tendem a reduzir relativamente a eficiência de tokens e, às vezes, o desempenho.
Se o seu harness de revisão de código foi ajustado para um modelo anterior, você pode inicialmente ver recall mais baixo no Claude Sonnet 5. Isso provavelmente é um efeito do harness, não uma regressão de capacidade. Quando um prompt de revisão diz coisas como "relate apenas problemas de alta severidade", "seja conservador" ou "não seja minucioso demais", o Claude Sonnet 5 pode seguir essa instrução mais fielmente do que modelos anteriores: ele pode investigar o código com a mesma profundidade, identificar os bugs e então não relatar descobertas que julga estarem abaixo do seu limite declarado. Isso pode se manifestar como o modelo fazendo a mesma profundidade de investigação, mas convertendo menos investigações em descobertas relatadas, especialmente em bugs de menor severidade. A precisão normalmente aumenta, mas o recall medido pode cair mesmo que a capacidade subjacente do modelo de encontrar bugs tenha melhorado.
Alguma linguagem de prompt recomendada:
Report every issue you find, including ones you are uncertain about or consider low-severity. Do not filter for importance or confidence at this stage - a separate verification step will do that. Your goal here is coverage: it is better to surface a finding that later gets filtered out than to silently drop a real bug. For each finding, include your confidence level and an estimated severity so a downstream filter can rank them.Este prompt pode ser usado sem ter uma segunda etapa real, mas mover a filtragem por confiança para fora da etapa de descoberta frequentemente ajuda. Se o seu harness tem uma etapa separada de verificação, deduplicação ou classificação, diga explicitamente ao modelo que seu trabalho na etapa de descoberta é cobertura, e não filtragem.
Se você quiser que o modelo faça autofiltragem em uma única passagem, seja concreto sobre onde está o limite, em vez de usar termos qualitativos como "importante": por exemplo, "relate quaisquer bugs que possam causar comportamento incorreto, falha em teste ou resultado enganoso; omita apenas detalhes menores como preferências puramente de estilo ou nomenclatura."
Itere nos prompts com um subconjunto das suas avaliações ou casos de teste para validar ganhos de recall ou F1 score.
O Claude Sonnet 5 suporta a versão de ferramenta computer_20251124. A capacidade de computer use (uso de computador) funciona em várias resoluções, até uma resolução máxima de 2576px / 3,75MP. Testes internos de computer use mostram que enviar imagens em 1080p oferece um bom equilíbrio entre desempenho e custo.
Para cargas de trabalho particularmente sensíveis a custo, 720p ou 1366×768 são opções de menor custo com bom desempenho. Conduza seus próprios testes para encontrar as configurações ideais para o seu caso de uso; experimentar com configurações de effort também pode ajudar a ajustar o comportamento do modelo.
Was this page helpful?