Was this page helpful?
Claude est capable de fournir des citations détaillées lors de la réponse à des questions sur des documents, vous aidant à suivre et vérifier les sources d'information dans les réponses.
Tous les modèles actifs supportent les citations, à l'exception de Haiku 3.
Citations avec Claude Sonnet 3.7
Claude Sonnet 3.7 peut être moins susceptible de faire des citations par rapport à d'autres modèles Claude sans des instructions plus explicites de la part de l'utilisateur. Lors de l'utilisation de citations avec Claude Sonnet 3.7, nous recommandons d'inclure des instructions supplémentaires dans le tour user, comme "Utilisez des citations pour soutenir votre réponse." par exemple.
Nous avons également observé que lorsque le modèle est invité à structurer sa réponse, il est peu probable qu'il utilise des citations à moins qu'on lui dise explicitement d'utiliser des citations dans ce format. Par exemple, si le modèle est invité à utiliser des balises <result> dans sa réponse, vous devriez ajouter quelque chose comme "Utilisez toujours des citations dans votre réponse, même dans les balises <result>."
Veuillez partager vos commentaires et suggestions sur la fonctionnalité de citations en utilisant ce formulaire.
Voici un exemple de comment utiliser les citations avec l'API Messages :
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": "The grass is green. The sky is blue."
},
"title": "My Document",
"context": "This is a trustworthy document.",
"citations": {"enabled": true}
},
{
"type": "text",
"text": "What color is the grass and sky?"
}
]
}
]
}'Comparaison avec les approches basées sur les invites
En comparaison avec les solutions de citations basées sur les invites, la fonctionnalité de citations présente les avantages suivants :
cited_text ne compte pas vers vos jetons de sortie.cited_text, les citations sont garanties de contenir des pointeurs valides vers les documents fournis.Intégrez les citations avec Claude en suivant ces étapes :
Fragmentation automatique vs contenu personnalisé
Par défaut, les documents en texte brut et PDF sont automatiquement fragmentés en phrases. Si vous avez besoin de plus de contrôle sur la granularité des citations (par exemple, pour les puces ou les transcriptions), utilisez plutôt des documents de contenu personnalisé. Voir Types de documents pour plus de détails.
Par exemple, si vous voulez que Claude soit capable de citer des phrases spécifiques de vos fragments RAG, vous devriez mettre chaque fragment RAG dans un document en texte brut. Sinon, si vous ne voulez pas de fragmentation supplémentaire, ou si vous voulez personnaliser toute fragmentation supplémentaire, vous pouvez mettre les fragments RAG dans des documents de contenu personnalisé.
source du document peut être cité.title et context sont des champs optionnels qui seront transmis au modèle mais ne seront pas utilisés pour le contenu cité.title est limité en longueur, vous pouvez donc trouver le champ context utile pour stocker les métadonnées du document sous forme de texte ou de json stringifié.content fournie dans le document de contenu personnalisé.cited_text est fourni pour la commodité et ne compte pas vers les jetons de sortie.cited_text ne compte pas non plus vers les jetons d'entrée.Les citations fonctionnent en conjonction avec d'autres fonctionnalités de l'API, notamment mise en cache des invites, comptage des jetons et traitement par lots.
Les citations et les sorties structurées sont incompatibles
Les citations ne peuvent pas être utilisées ensemble avec Sorties structurées. Si vous activez les citations sur un document fourni par l'utilisateur (blocs Document ou RequestSearchResultBlock) et que vous incluez également le paramètre output_config.format (ou le paramètre déprécié output_format), l'API retournera une erreur 400.
C'est parce que les citations nécessitent d'entrelacer les blocs de citations avec la sortie de texte, ce qui est incompatible avec les contraintes strictes du schéma JSON des sorties structurées.
Les citations et la mise en cache des invites peuvent être utilisées ensemble efficacement.
Les blocs de citations générés dans les réponses ne peuvent pas être mis en cache directement, mais les documents source auxquels ils font référence peuvent l'être. Pour optimiser les performances, appliquez cache_control à vos blocs de contenu de document de niveau supérieur.
Dans cet exemple :
cache_control sur le bloc de documentNous supportons trois types de documents pour les citations. Les documents peuvent être fournis directement dans le message (base64, texte ou URL) ou téléchargés via l'API Files et référencés par file_id :
| Type | Meilleur pour | Fragmentation | Format de citation |
|---|---|---|---|
| Texte brut | Documents texte simples, prose | Phrase | Indices de caractères (indexés à partir de 0) |
| Fichiers PDF avec contenu texte | Phrase | Numéros de page (indexés à partir de 1) | |
| Contenu personnalisé | Listes, transcriptions, formatage spécial, citations plus granulaires | Pas de fragmentation supplémentaire | Indices de blocs (indexés à partir de 0) |
Les fichiers .csv, .xlsx, .docx, .md et .txt ne sont pas supportés en tant que blocs de document. Convertissez-les en texte brut et incluez-les directement dans le contenu du message. Voir Travailler avec d'autres formats de fichiers.
Les documents en texte brut sont automatiquement fragmentés en phrases. Vous pouvez les fournir en ligne ou par référence avec leur file_id :
Les documents PDF peuvent être fournis sous forme de données codées en base64 ou par file_id. Le texte PDF est extrait et fragmenté en phrases. Comme les citations d'images ne sont pas encore supportées, les PDF qui sont des numérisations de documents et ne contiennent pas de texte extractible ne seront pas citables.
Les documents de contenu personnalisé vous donnent le contrôle sur la granularité des citations. Aucune fragmentation supplémentaire n'est effectuée et les fragments sont fournis au modèle selon les blocs de contenu fournis.
{
"type": "document",
"source": {
"type": "content",
"content": [
{"type": "text", "text": "First chunk"},
{"type": "text", "text": "Second chunk"}
]
},
"title": "Document Title", # optional
"context": "Context about the document that will not be cited from", # optional
"citations": {"enabled": True}
}Lorsque les citations sont activées, les réponses incluent plusieurs blocs de texte avec des citations :
{
"content": [
{
"type": "text",
"text": "According to the document, "
},
{
"type": "text",
"text": "the grass is green",
"citations": [{
"type": "char_location",
"cited_text": "The grass is green.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 0,
"end_char_index": 20
}]
},
{
"type": "text",
"text": " and "
},
{
"type": "text",
"text": "the sky is blue",
"citations": [{
"type": "char_location",
"cited_text": "The sky is blue.",
"document_index": 0,
"document_title": "Example Document",
"start_char_index": 20,
"end_char_index": 36
}]
},
{
"type": "text",
"text": ". Information from page 5 states that ",
},
{
"type": "text",
"text": "water is essential",
"citations": [{
"type": "page_location",
"cited_text": "Water is essential for life.",
"document_index": 1,
"document_title": "PDF Document",
"start_page_number": 5,
"end_page_number": 6
}]
},
{
"type": "text",
"text": ". The custom document mentions ",
},
{
"type": "text",
"text": "important findings",
"citations": [{
"type": "content_block_location",
"cited_text": "These are important findings.",
"document_index": 2,
"document_title": "Custom Content Document",
"start_block_index": 0,
"end_block_index": 1
}]
}
]
}Pour les réponses en streaming, nous avons ajouté un type citations_delta qui contient une seule citation à ajouter à la liste citations sur le bloc de contenu text actuel.
Fournir des documents et activer les citations
citations.enabled=true sur chacun de vos documents. Actuellement, les citations doivent être activées sur tous les documents ou sur aucun d'entre eux dans une demande.Les documents sont traités
Claude fournit une réponse citée
import anthropic
client = anthropic.Anthropic()
# Contenu de document long (par exemple, documentation technique)
long_document = "This is a very long document with thousands of words..." + " ... " * 1000 # Longueur minimale citable
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "document",
"source": {
"type": "text",
"media_type": "text/plain",
"data": long_document
},
"citations": {"enabled": True},
"cache_control": {"type": "ephemeral"} # Mettre en cache le contenu du document
},
{
"type": "text",
"text": "What does this document say about API features?"
}
]
}
]
)