Consultez le cookbook de résumé pour voir un exemple d'implémentation de résumé juridique utilisant Claude.
Voici quelques indicateurs clés suggérant que vous devriez employer un LLM comme Claude pour résumer des documents juridiques :
Il n'existe pas de résumé unique correct pour un document donné. Sans directives claires, il peut être difficile pour Claude de déterminer quels détails inclure. Pour obtenir des résultats optimaux, identifiez les informations spécifiques que vous souhaitez inclure dans le résumé.
Par exemple, lors du résumé d'un contrat de sous-location, vous pourriez souhaiter extraire les points clés suivants :
details_to_extract = [
"Parties involved (sublessor, sublessee, and original lessor)",
"Property details (address, description, and permitted use)",
"Term and rent (start date, end date, monthly rent, and security deposit)",
"Responsibilities (utilities, maintenance, and repairs)",
"Consent and notices (landlord's consent, and notice requirements)",
"Special provisions (furniture, parking, and subletting restrictions)",
]L'évaluation de la qualité des résumés est une tâche notoirement difficile. Contrairement à de nombreuses autres tâches de traitement du langage naturel, l'évaluation des résumés manque souvent de métriques claires et objectives. Le processus peut être hautement subjectif, différents lecteurs valorisant différents aspects d'un résumé. Voici des critères que vous pourriez prendre en compte pour évaluer la qualité des résumés juridiques produits par Claude.
Consultez le guide sur l'établissement de critères de réussite pour plus d'informations.
La précision du modèle est extrêmement importante lors du résumé de documents juridiques. Claude Opus 4.8 est un excellent choix pour les cas d'usage comme celui-ci où une grande précision est requise. Si la taille et la quantité de vos documents sont importantes au point que les coûts deviennent préoccupants, vous pouvez également essayer d'utiliser un modèle plus petit comme Claude Haiku 4.5.
Pour vous aider à estimer ces coûts, voici une comparaison du coût de résumé de 1 000 contrats de sous-location en utilisant Opus et Haiku :
Taille du contenu
Tokens estimés
Coût estimé pour Claude Opus 4.8
Avant de commencer à résumer des documents, vous devez préparer vos données. Cela implique d'extraire le texte des PDF, de nettoyer le texte et de vous assurer qu'il est prêt à être traité par Claude.
Voici une démonstration de ce processus sur un exemple de PDF :
from io import BytesIO
import re
import pypdf
import requests
def get_llm_text(pdf_file):
reader = pypdf.PdfReader(pdf_file)
text = "\n".join([page.extract_text() for page in reader.pages])
# Supprimer les numéros de page
text = re.sub(r"\n\s*\d+\s*\n", "\n", text)
# Supprimer les espaces superflus
text = re.sub(r"\s+", " ", text)
return text
# Créer l'URL complète à partir du dépôt GitHub
url = "https://raw.githubusercontent.com/anthropics/anthropic-cookbook/main/skills/summarization/data/Sample Sublease Agreement.pdf"
url = url.replace(" ", "%20")
# Télécharger le fichier PDF en mémoire
response = requests.get(url)
# Charger le PDF depuis la mémoire
pdf_file = BytesIO(response.content)
document_text = get_llm_text(pdf_file)
print(document_text[:50000])Dans cet exemple, vous téléchargez d'abord un PDF d'un exemple de contrat de sous-location utilisé dans le cookbook de résumé. Ce contrat provient d'un contrat de sous-location accessible au public sur le site web sec.gov.
L'exemple utilise la bibliothèque pypdf pour extraire le contenu du PDF et le convertir en texte. Les données textuelles sont ensuite nettoyées en supprimant les numéros de page et les espaces superflus.
Claude peut s'adapter à divers styles de résumé. Vous pouvez modifier les détails du prompt pour guider Claude à être plus ou moins verbeux, à inclure plus ou moins de terminologie technique, ou à fournir un résumé de niveau plus ou moins élevé du contexte en question.
Voici un exemple de création d'un prompt qui garantit que les résumés générés suivent une structure cohérente lors de l'analyse de contrats de sous-location :
# Initialiser le client Anthropic
client = anthropic.Anthropic()
def summarize_document(
text, details_to_extract, model="claude-opus-4-8", max_tokens=1000
):
# Formater les détails à extraire pour les placer dans le contexte du prompt
details_to_extract_str = "\n".join(details_to_extract)
# Demander au modèle de résumer le contrat de sous-location
prompt = f"""Summarize the following sublease agreement. Focus on these key aspects:
{details_to_extract_str}
Provide the summary in bullet points nested within the XML header for each section. For example:
<parties involved>
- Sublessor: [Name]
// Add more details as needed
</parties involved>
If any information is not explicitly stated in the document, note it as "Not specified". Do not preamble.
Sublease agreement text:
{text}
"""
response = client.messages.create(
model=model,
max_tokens=max_tokens,
system="You are a legal analyst specializing in real estate law, known for highly accurate and detailed summaries of sublease agreements.",
messages=[
{"role": "user", "content": prompt},
],
)
return response.content[0].text
sublease_summary = summarize_document(document_text, details_to_extract)
print(sublease_summary)Ce code implémente une fonction summarize_document qui utilise Claude pour résumer le contenu d'un contrat de sous-location. La fonction accepte une chaîne de texte et une liste de détails à extraire comme entrées. Dans cet exemple, le code appelle la fonction avec les variables document_text et details_to_extract qui ont été définies dans les extraits de code précédents.
Au sein de la fonction, un prompt est généré pour Claude, incluant le document à résumer, les détails à extraire et des instructions spécifiques pour résumer le document. Le prompt demande à Claude de répondre avec un résumé de chaque détail à extraire, imbriqué dans des en-têtes XML.
Comme le code produit chaque section du résumé à l'intérieur de balises, chaque section peut facilement être extraite lors d'une étape de post-traitement. Cette approche permet des résumés structurés qui peuvent être adaptés à votre cas d'usage, de sorte que chaque résumé suive le même modèle.
Le prompting nécessite souvent des tests et une optimisation avant d'être prêt pour la production. Pour déterminer si votre solution est prête, évaluez la qualité de vos résumés à l'aide d'un processus systématique combinant des méthodes quantitatives et qualitatives. La création d'une évaluation empirique solide basée sur vos critères de réussite définis vous permet d'optimiser vos prompts. Voici quelques métriques que vous pourriez inclure dans votre évaluation empirique :
Voici quelques considérations supplémentaires à garder à l'esprit lors du déploiement de votre solution en production.
Garantir l'absence de responsabilité : Comprenez les implications juridiques des erreurs dans les résumés, qui pourraient entraîner une responsabilité juridique pour votre organisation ou vos clients. Fournissez des avertissements ou des mentions légales précisant que les résumés sont générés par l'IA et doivent être examinés par des professionnels du droit.
Gérer divers types de documents : Ce guide explique comment extraire du texte à partir de PDF. Dans le monde réel, les documents peuvent se présenter sous divers formats (PDF, documents Word, fichiers texte, etc.). Assurez-vous que votre pipeline d'extraction de données peut convertir tous les formats de fichiers que vous prévoyez de recevoir.
Paralléliser les appels API à Claude : Les documents longs comportant un grand nombre de tokens peuvent nécessiter jusqu'à une minute pour que Claude génère un résumé. Pour les grandes collections de documents, vous pouvez envoyer des appels API à Claude en parallèle afin que les résumés puissent être terminés dans un délai raisonnable. Consultez les limites de débit d'Anthropic pour déterminer le nombre maximal d'appels API pouvant être effectués en parallèle.
Dans des scénarios complexes, il peut être utile d'envisager des stratégies supplémentaires pour améliorer les performances au-delà des techniques standard d'ingénierie de prompts. Voici quelques stratégies avancées :
Le résumé juridique implique souvent de traiter de longs documents ou de nombreux documents connexes à la fois, de sorte que vous dépassez la fenêtre de contexte de Claude. Vous pouvez utiliser une méthode de découpage appelée méta-résumé pour gérer ce cas d'usage. Cette technique consiste à diviser les documents en morceaux plus petits et gérables, puis à traiter chaque morceau séparément. Vous pouvez ensuite combiner les résumés de chaque morceau pour créer un méta-résumé de l'ensemble du document.
Voici un exemple de réalisation d'un méta-résumé :
# Initialiser le client Anthropic
client = anthropic.Anthropic()
def chunk_text(text, chunk_size=20000):
return [text[i : i + chunk_size] for i in range(0, len(text), chunk_size)]
def summarize_long_document(
text, details_to_extract, model="claude-opus-4-8", max_tokens=1000
):
# Formater les détails à extraire pour les placer dans le contexte du prompt
details_to_extract_str = "\n".join(details_to_extract)
# Itérer sur les segments et résumer chacun d'eux
chunk_summaries = [
summarize_document(
chunk, details_to_extract, model=model, max_tokens=max_tokens
)
for chunk in chunk_text(text)
]
final_summary_prompt = f"""
You are looking at the chunked summaries of multiple documents that are all related.
Combine the following summaries of the document from different truthful sources into a coherent overall summary:
<chunked_summaries>
{"".join(chunk_summaries)}
</chunked_summaries>
Focus on these key aspects:
{details_to_extract_str}
Provide the summary in bullet points nested within the XML header for each section. For example:
<parties involved>
- Sublessor: [Name]
// Add more details as needed
</parties involved>
If any information is not explicitly stated in the document, note it as "Not specified". Do not preamble.
"""
response = client.messages.create(
model=model,
max_tokens=max_tokens,
system="You are a legal expert that summarizes notes on one document.",
messages=[
{"role": "user", "content": final_summary_prompt},
],
)
return response.content[0].text
long_summary = summarize_long_document(document_text, details_to_extract)
print(long_summary)La fonction summarize_long_document s'appuie sur la fonction summarize_document précédente en divisant le document en morceaux plus petits et en résumant chaque morceau individuellement.
Le code y parvient en appliquant la fonction summarize_document à chaque morceau de 20 000 caractères du document original. Les résumés individuels sont ensuite combinés, et un résumé final est créé à partir de ces résumés de morceaux.
Notez que la fonction summarize_long_document n'est pas strictement nécessaire pour l'exemple de PDF, car l'ensemble du document tient dans la fenêtre de contexte de Claude. Cependant, elle devient essentielle pour les documents dépassant la fenêtre de contexte de Claude ou lors du résumé de plusieurs documents connexes ensemble. Quoi qu'il en soit, cette technique de méta-résumé capture souvent des détails importants supplémentaires dans le résumé final qui avaient été omis dans l'approche précédente à résumé unique.
La recherche dans une collection de documents avec un LLM implique généralement la « retrieval-augmented generation » (génération augmentée par récupération), ou RAG. Cependant, dans les scénarios impliquant de grands documents ou lorsque la récupération précise d'informations est cruciale, une approche RAG de base peut être insuffisante. Les documents indexés par résumé constituent une approche RAG avancée qui offre un moyen plus efficace de classer les documents pour la récupération, en utilisant moins de contexte que les méthodes RAG traditionnelles. Dans cette approche, vous utilisez d'abord Claude pour générer un résumé concis de chaque document de votre corpus, puis vous utilisez Claude pour classer la pertinence de chaque résumé par rapport à la requête posée. Pour plus de détails sur cette approche, y compris un exemple basé sur du code, consultez la section sur les documents indexés par résumé dans le cookbook de résumé.
Une autre technique avancée pour améliorer la capacité de Claude à générer des résumés est le « fine-tuning » (ajustement fin). Le fine-tuning consiste à entraîner Claude sur un jeu de données personnalisé qui correspond spécifiquement à vos besoins en matière de résumé juridique, garantissant que Claude s'adapte à votre cas d'usage. Voici un aperçu de la manière d'effectuer un fine-tuning :
Identifier les erreurs : Commencez par collecter les cas où les résumés de Claude sont insuffisants — cela peut inclure l'omission de détails juridiques critiques, une mauvaise compréhension du contexte ou l'utilisation d'une terminologie juridique inappropriée.
Constituer un jeu de données : Une fois ces problèmes identifiés, compilez un jeu de données de ces exemples problématiques. Ce jeu de données doit inclure les documents juridiques originaux ainsi que vos résumés corrigés, garantissant que Claude apprend le comportement souhaité.
Effectuer le fine-tuning : Le fine-tuning consiste à réentraîner le modèle sur votre jeu de données constitué afin d'ajuster ses poids et paramètres. Ce réentraînement aide Claude à mieux comprendre les exigences spécifiques de votre domaine juridique, améliorant sa capacité à résumer les documents selon vos normes.
Amélioration itérative : Le fine-tuning n'est pas un processus ponctuel. À mesure que Claude continue de générer des résumés, vous pouvez ajouter de manière itérative de nouveaux exemples où il a sous-performé, affinant davantage ses capacités. Au fil du temps, cette boucle de rétroaction continue aboutira à un modèle hautement spécialisé pour vos tâches de résumé juridique.
Consultez un exemple de code entièrement implémenté montrant comment utiliser Claude pour résumer des contrats.
Explorez la recette du cookbook de citations pour obtenir des conseils sur la manière de garantir l'exactitude et l'explicabilité des informations.
Was this page helpful?
Coût estimé pour Claude Haiku 4.5