Loading...
    • Guia do Desenvolvedor
    • Referência da API
    • MCP
    • Recursos
    • Notas de lançamento
    Search...
    ⌘K
    Primeiros passos
    Introdução ao ClaudeInício rápido
    Modelos e preços
    Visão geral dos modelosEscolhendo um modeloNovidades no Claude 4.6Guia de migraçãoDescontinuação de modelosPreços
    Construir com Claude
    Visão geral de recursosUsando a API MessagesTratando razões de paradaMelhores práticas de prompts
    Gerenciamento de contexto
    Janelas de contextoCompactaçãoEdição de contexto
    Capacidades
    Cache de promptsPensamento estendidoPensamento adaptativoEsforçoStreaming de mensagensProcessamento em loteCitaçõesSuporte multilíngueContagem de tokensEmbeddingsVisãoSuporte a PDFAPI de ArquivosResultados de pesquisaSaídas estruturadas
    Ferramentas
    Visão geralComo implementar o uso de ferramentasStreaming de ferramentas granularFerramenta BashFerramenta de execução de códigoChamada de ferramentas programáticaFerramenta de uso de computadorFerramenta de editor de textoFerramenta de busca na webFerramenta de pesquisa na webFerramenta de memóriaFerramenta de busca de ferramentas
    Habilidades de agente
    Visão geralInício rápidoMelhores práticasHabilidades para empresasUsando habilidades com a API
    Agent SDK
    Visão geralInício rápidoSDK TypeScriptTypeScript V2 (prévia)SDK PythonGuia de migração
    MCP na API
    Conector MCPServidores MCP remotos
    Claude em plataformas de terceiros
    Amazon BedrockMicrosoft FoundryVertex AI
    Engenharia de prompts
    Visão geralGerador de promptsUsar modelos de promptsMelhorador de promptsSeja claro e diretoUse exemplos (prompting multishotshot)Deixe Claude pensar (CoT)Use tags XMLDê um papel ao Claude (prompts do sistema)Encadear prompts complexosDicas de contexto longoDicas de pensamento estendido
    Testar e avaliar
    Definir critérios de sucessoDesenvolver casos de testeUsando a ferramenta de avaliaçãoReduzindo latência
    Fortalecer proteções
    Reduzir alucinaçõesAumentar consistência de saídaMitigar jailbreaksRecusas de streamingReduzir vazamento de promptManter Claude em personagem
    Administração e monitoramento
    Visão geral da API AdminResidência de dadosEspaços de trabalhoAPI de uso e custoAPI de análise de código ClaudeRetenção zero de dados
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Fortalecer proteções

    Mitigar jailbreaks e injeções de prompt

    Aprenda estratégias para fortalecer suas proteções contra jailbreaks e injeções de prompt em aplicações Claude

    Jailbreaking e injeções de prompt ocorrem quando usuários criam prompts para explorar vulnerabilidades do modelo, visando gerar conteúdo inadequado. Embora Claude seja inerentemente resiliente a tais ataques, aqui estão passos adicionais para fortalecer suas proteções, particularmente contra usos que violem nossos Termos de Serviço ou Política de Uso.

    Claude é muito mais resistente a jailbreaking do que outros LLMs principais, graças a métodos avançados de treinamento como Constitutional AI.
    • Telas de inofensividade: Use um modelo leve como Claude Haiku 3 para pré-verificar entradas de usuários. (Nota: prefilling está descontinuado e não é suportado em Claude Opus 4.6 e Sonnet 4.5.)

    • Validação de entrada: Filtre prompts para padrões de jailbreaking. Você pode até usar um LLM para criar uma tela de validação generalizada fornecendo linguagem de jailbreaking conhecida como exemplos.

    • Engenharia de prompt: Crie prompts que enfatizem limites éticos e legais.

    Ajuste respostas e considere limitar a taxa ou banir usuários que repetidamente se envolvem em comportamento abusivo tentando contornar as proteções do Claude. Por exemplo, se um usuário específico dispara o mesmo tipo de recusa várias vezes (por exemplo, "saída bloqueada pela política de filtragem de conteúdo"), diga ao usuário que suas ações violam as políticas de uso relevantes e tome medidas adequadamente.

    • Monitoramento contínuo: Analise regularmente os resultados para sinais de jailbreaking. Use este monitoramento para refinar iterativamente seus prompts e estratégias de validação.

    Avançado: Proteções em cadeia

    Combine estratégias para proteção robusta. Aqui está um exemplo de nível empresarial com uso de ferramentas:

    Ao colocar em camadas essas estratégias, você cria uma defesa robusta contra jailbreaking e injeções de prompt, garantindo que suas aplicações alimentadas por Claude mantenham os mais altos padrões de segurança e conformidade.

    Was this page helpful?

    • Avançado: Proteções em cadeia
    • Prompt de sistema do bot
    • Prompt dentro da ferramenta harmlessness_screen