MessaggiLavorare con i file

Supporto PDF

Elabora PDF con Claude. Estrai testo, analizza grafici e comprendi contenuti visivi dai tuoi documenti.

Questa funzionalità è idonea per la Zero Data Retention (ZDR). Quando la tua organizzazione dispone di un accordo ZDR, i dati inviati tramite questa funzionalità non vengono conservati dopo che la risposta dell'API è stata restituita.

Puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d'uso di esempio:

Analizzare report finanziari e comprendere grafici/tabelle
Estrarre informazioni chiave da documenti legali
Assistenza alla traduzione di documenti
Convertire le informazioni dei documenti in formati strutturati

Prima di iniziare

Verifica i requisiti PDF

Claude funziona con qualsiasi PDF standard. Assicurati che la dimensione della tua richiesta soddisfi questi requisiti:

Requisito	Limite
Dimensione massima della richiesta	32 MB (varia in base alla piattaforma)
Numero massimo di pagine per richiesta	600 (100 per i modelli con una finestra di contesto da 200k token)
Formato	PDF standard (senza password/crittografia)

Entrambi i limiti si applicano all'intero payload della richiesta, incluso qualsiasi altro contenuto inviato insieme ai PDF. Per PDF di grandi dimensioni, considera di caricarli con la Files API e di farvi riferimento tramite file_id per mantenere ridotti i payload delle richieste.

I PDF densi (molte pagine con caratteri piccoli, tabelle complesse o grafica pesante) possono riempire la "context window" (finestra di contesto) prima di raggiungere il limite di pagine. Le richieste con PDF di grandi dimensioni possono anche fallire prima di raggiungere il limite di pagine, anche quando si utilizza la Files API. Prova a dividere il documento in sezioni; per file di grandi dimensioni, poiché ogni pagina viene elaborata come immagine, anche il sottocampionamento delle immagini incorporate può essere utile.

Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni e considerazioni degli altri task di visione.

Piattaforme e modelli supportati

Il supporto PDF è disponibile sull'API Claude, Claude Platform su AWS, Amazon Bedrock (vedi Supporto PDF su Amazon Bedrock), Google Cloud e Microsoft Foundry. Tutti i modelli attivi supportano l'elaborazione dei PDF.

Supporto PDF su Amazon Bedrock

Quando si utilizza il supporto PDF tramite la Converse API di Bedrock, esistono due modalità distinte di elaborazione dei documenti:

Importante: Per accedere alle complete capacità di comprensione visiva dei PDF di Claude nella Converse API, devi abilitare le citazioni. Senza le citazioni abilitate, l'API ricorre solo all'estrazione di testo di base. Scopri di più su come lavorare con le citazioni.

Modalità di elaborazione dei documenti

Converse Document Chat (Modalità originale - Solo estrazione di testo)
- Fornisce l'estrazione di testo di base dai PDF
- Non può analizzare immagini, grafici o layout visivi all'interno dei PDF
- Utilizza circa 1.000 token per un PDF di 3 pagine
- Utilizzata automaticamente quando le citazioni non sono abilitate
Claude PDF Chat (Nuova modalità - Comprensione visiva completa)
- Fornisce un'analisi visiva completa dei PDF
- Può comprendere e analizzare grafici, diagrammi, immagini e layout visivi
- Elabora ogni pagina sia come testo che come immagine per una comprensione completa
- Utilizza circa 7.000 token per un PDF di 3 pagine
- Richiede che le citazioni siano abilitate nella Converse API

Limitazioni principali

Converse API: L'analisi visiva dei PDF richiede che le citazioni siano abilitate. Attualmente non esiste alcuna opzione per utilizzare l'analisi visiva senza citazioni (a differenza della InvokeModel API).
InvokeModel API: Fornisce il controllo completo sull'elaborazione dei PDF senza citazioni forzate.

Problemi comuni

Se Claude non vede immagini o grafici nei tuoi PDF quando utilizzi la Converse API, probabilmente devi abilitare il flag delle citazioni. Senza di esso, Converse ricorre solo all'estrazione di testo di base.

Questo è un vincolo noto della Converse API. Per le applicazioni che richiedono l'analisi visiva dei PDF senza citazioni, considera di utilizzare invece la InvokeModel API.

Per file non PDF come .csv, .xlsx, .docx, .md o .txt, consulta Lavorare con altri formati di file.

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Iniziamo con un semplice esempio utilizzando la Messages API. Puoi fornire PDF a Claude in tre modi:

Come riferimento URL a un PDF ospitato online
Come PDF codificato in base64 nei blocchi di contenuto document
Tramite un file_id dalla Files API

Su Amazon Bedrock e Google Cloud, attualmente sono disponibili solo sorgenti codificate in base64.

Opzione 1: Documento PDF basato su URL

L'approccio più semplice è fare riferimento a un PDF direttamente da un URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opzione 2: Documento PDF codificato in base64

Se devi inviare PDF dal tuo sistema locale o quando un URL non è disponibile:

import base64
import httpx

# Per prima cosa, carica e codifica il PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: carica da un file locale
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Invia a Claude usando la codifica base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opzione 3: Files API

Per i PDF che utilizzerai ripetutamente, o quando vuoi evitare l'overhead della codifica, usa la Files API:

client = anthropic.Anthropic()

# Carica il file PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Usa il file caricato in un messaggio
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Come funziona il supporto PDF

Quando invii un PDF a Claude, si verificano i seguenti passaggi:

Il sistema estrae i contenuti del documento.
- Il sistema converte ogni pagina del documento in un'immagine.
- Il testo di ogni pagina viene estratto e fornito insieme all'immagine di ciascuna pagina.
Claude analizza sia il testo che le immagini per comprendere meglio il documento.
- I documenti vengono forniti come combinazione di testo e immagini per l'analisi.
- Questo consente agli utenti di richiedere approfondimenti sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
Claude risponde, facendo riferimento ai contenuti del PDF se pertinenti.
Claude può fare riferimento sia al contenuto testuale che a quello visivo quando risponde. Puoi migliorare ulteriormente le prestazioni integrando il supporto PDF con:
- Cache dei prompt: Per migliorare le prestazioni per analisi ripetute.
- Elaborazione batch: Per l'elaborazione di documenti ad alto volume.
- Uso degli strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input degli strumenti.

Stima i tuoi costi

Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine:

Costi dei token di testo: Ogni pagina utilizza tipicamente 1.500-3.000 token per pagina a seconda della densità del contenuto. Si applicano i prezzi standard dell'API senza costi aggiuntivi per i PDF.
Costi dei token delle immagini: Poiché ogni pagina viene convertita in un'immagine, si applicano gli stessi calcoli dei costi basati sulle immagini.

Puoi utilizzare il conteggio dei token per stimare i costi per i tuoi PDF specifici.

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Segui queste best practice per risultati ottimali:

Posiziona i PDF prima del testo nelle tue richieste
Usa font standard
Assicurati che il testo sia chiaro e leggibile
Ruota le pagine nell'orientamento verticale corretto
Usa numeri di pagina logici (dal visualizzatore PDF) nei prompt
Dividi i PDF di grandi dimensioni in parti quando necessario
Abilita la cache dei prompt per analisi ripetute

Scala la tua implementazione

Per l'elaborazione ad alto volume, considera questi approcci:

Usa la cache dei prompt

Memorizza i PDF nella cache per migliorare le prestazioni su query ripetute:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Elabora batch di documenti

Usa la Message Batches API per flussi di lavoro ad alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Passaggi successivi

Prova gli esempi PDF

Esplora esempi pratici di elaborazione PDF nella ricetta del cookbook.

Visualizza il riferimento API

Consulta la documentazione API completa per il supporto PDF.

Was this page helpful?

MessaggiLavorare con i file

Supporto PDF

Elabora PDF con Claude. Estrai testo, analizza grafici e comprendi contenuti visivi dai tuoi documenti.

Puoi chiedere a Claude informazioni su qualsiasi testo, immagine, grafico e tabella nei PDF che fornisci. Alcuni casi d'uso di esempio:

Analizzare report finanziari e comprendere grafici/tabelle
Estrarre informazioni chiave da documenti legali
Assistenza alla traduzione di documenti
Convertire le informazioni dei documenti in formati strutturati

Prima di iniziare

Verifica i requisiti PDF

Claude funziona con qualsiasi PDF standard. Assicurati che la dimensione della tua richiesta soddisfi questi requisiti:

Requisito	Limite
Dimensione massima della richiesta	32 MB (varia in base alla piattaforma)
Numero massimo di pagine per richiesta	600 (100 per i modelli con una finestra di contesto da 200k token)
Formato	PDF standard (senza password/crittografia)

Poiché il supporto PDF si basa sulle capacità di visione di Claude, è soggetto alle stesse limitazioni e considerazioni degli altri task di visione.

Piattaforme e modelli supportati

Supporto PDF su Amazon Bedrock

Quando si utilizza il supporto PDF tramite la Converse API di Bedrock, esistono due modalità distinte di elaborazione dei documenti:

Modalità di elaborazione dei documenti

Converse Document Chat (Modalità originale - Solo estrazione di testo)
- Fornisce l'estrazione di testo di base dai PDF
- Non può analizzare immagini, grafici o layout visivi all'interno dei PDF
- Utilizza circa 1.000 token per un PDF di 3 pagine
- Utilizzata automaticamente quando le citazioni non sono abilitate
Claude PDF Chat (Nuova modalità - Comprensione visiva completa)
- Fornisce un'analisi visiva completa dei PDF
- Può comprendere e analizzare grafici, diagrammi, immagini e layout visivi
- Elabora ogni pagina sia come testo che come immagine per una comprensione completa
- Utilizza circa 7.000 token per un PDF di 3 pagine
- Richiede che le citazioni siano abilitate nella Converse API

Limitazioni principali

Converse API: L'analisi visiva dei PDF richiede che le citazioni siano abilitate. Attualmente non esiste alcuna opzione per utilizzare l'analisi visiva senza citazioni (a differenza della InvokeModel API).
InvokeModel API: Fornisce il controllo completo sull'elaborazione dei PDF senza citazioni forzate.

Problemi comuni

Questo è un vincolo noto della Converse API. Per le applicazioni che richiedono l'analisi visiva dei PDF senza citazioni, considera di utilizzare invece la InvokeModel API.

Per file non PDF come .csv, .xlsx, .docx, .md o .txt, consulta Lavorare con altri formati di file.

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Iniziamo con un semplice esempio utilizzando la Messages API. Puoi fornire PDF a Claude in tre modi:

Come riferimento URL a un PDF ospitato online
Come PDF codificato in base64 nei blocchi di contenuto document
Tramite un file_id dalla Files API

Su Amazon Bedrock e Google Cloud, attualmente sono disponibili solo sorgenti codificate in base64.

Opzione 1: Documento PDF basato su URL

L'approccio più semplice è fare riferimento a un PDF direttamente da un URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opzione 2: Documento PDF codificato in base64

Se devi inviare PDF dal tuo sistema locale o quando un URL non è disponibile:

import base64
import httpx

# Per prima cosa, carica e codifica il PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Alternativa: carica da un file locale
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Invia a Claude usando la codifica base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Opzione 3: Files API

Per i PDF che utilizzerai ripetutamente, o quando vuoi evitare l'overhead della codifica, usa la Files API:

client = anthropic.Anthropic()

# Carica il file PDF
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Usa il file caricato in un messaggio
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Come funziona il supporto PDF

Quando invii un PDF a Claude, si verificano i seguenti passaggi:

Il sistema estrae i contenuti del documento.
- Il sistema converte ogni pagina del documento in un'immagine.
- Il testo di ogni pagina viene estratto e fornito insieme all'immagine di ciascuna pagina.
Claude analizza sia il testo che le immagini per comprendere meglio il documento.
- I documenti vengono forniti come combinazione di testo e immagini per l'analisi.
- Questo consente agli utenti di richiedere approfondimenti sugli elementi visivi di un PDF, come grafici, diagrammi e altri contenuti non testuali.
Claude risponde, facendo riferimento ai contenuti del PDF se pertinenti.
Claude può fare riferimento sia al contenuto testuale che a quello visivo quando risponde. Puoi migliorare ulteriormente le prestazioni integrando il supporto PDF con:
- Cache dei prompt: Per migliorare le prestazioni per analisi ripetute.
- Elaborazione batch: Per l'elaborazione di documenti ad alto volume.
- Uso degli strumenti: Per estrarre informazioni specifiche dai documenti da utilizzare come input degli strumenti.

Stima i tuoi costi

Il conteggio dei token di un file PDF dipende dal testo totale estratto dal documento e dal numero di pagine:

Costi dei token di testo: Ogni pagina utilizza tipicamente 1.500-3.000 token per pagina a seconda della densità del contenuto. Si applicano i prezzi standard dell'API senza costi aggiuntivi per i PDF.
Costi dei token delle immagini: Poiché ogni pagina viene convertita in un'immagine, si applicano gli stessi calcoli dei costi basati sulle immagini.

Puoi utilizzare il conteggio dei token per stimare i costi per i tuoi PDF specifici.

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Segui queste best practice per risultati ottimali:

Posiziona i PDF prima del testo nelle tue richieste
Usa font standard
Assicurati che il testo sia chiaro e leggibile
Ruota le pagine nell'orientamento verticale corretto
Usa numeri di pagina logici (dal visualizzatore PDF) nei prompt
Dividi i PDF di grandi dimensioni in parti quando necessario
Abilita la cache dei prompt per analisi ripetute

Scala la tua implementazione

Per l'elaborazione ad alto volume, considera questi approcci:

Usa la cache dei prompt

Memorizza i PDF nella cache per migliorare le prestazioni su query ripetute:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Elabora batch di documenti

Usa la Message Batches API per flussi di lavoro ad alto volume:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Passaggi successivi

Prova gli esempi PDF

Esplora esempi pratici di elaborazione PDF nella ricetta del cookbook.

Visualizza il riferimento API

Consulta la documentazione API completa per il supporto PDF.

Was this page helpful?

Prima di iniziare

Verifica i requisiti PDF

Piattaforme e modelli supportati

Supporto PDF su Amazon Bedrock

Modalità di elaborazione dei documenti

Limitazioni principali

Problemi comuni

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Opzione 1: Documento PDF basato su URL

Opzione 2: Documento PDF codificato in base64

Opzione 3: Files API

Come funziona il supporto PDF

Stima i tuoi costi

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Scala la tua implementazione

Usa la cache dei prompt

Elabora batch di documenti

Passaggi successivi

Prima di iniziare

Verifica i requisiti PDF

Piattaforme e modelli supportati

Supporto PDF su Amazon Bedrock

Modalità di elaborazione dei documenti

Limitazioni principali

Problemi comuni

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Opzione 1: Documento PDF basato su URL

Opzione 2: Documento PDF codificato in base64

Opzione 3: Files API

Come funziona il supporto PDF

Stima i tuoi costi

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Scala la tua implementazione

Usa la cache dei prompt

Elabora batch di documenti

Passaggi successivi

Prima di iniziare

Verifica i requisiti PDF

Piattaforme e modelli supportati

Supporto PDF su Amazon Bedrock

Modalità di elaborazione dei documenti

Limitazioni principali

Problemi comuni

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Opzione 1: Documento PDF basato su URL

Opzione 2: Documento PDF codificato in base64

Opzione 3: Files API

Come funziona il supporto PDF

Stima i tuoi costi

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Scala la tua implementazione

Usa la cache dei prompt

Elabora batch di documenti

Passaggi successivi

Prima di iniziare

Verifica i requisiti PDF

Piattaforme e modelli supportati

Supporto PDF su Amazon Bedrock

Modalità di elaborazione dei documenti

Limitazioni principali

Problemi comuni

Elabora PDF con Claude

Invia la tua prima richiesta PDF

Opzione 1: Documento PDF basato su URL

Opzione 2: Documento PDF codificato in base64

Opzione 3: Files API

Come funziona il supporto PDF

Stima i tuoi costi

Ottimizza l'elaborazione dei PDF

Migliora le prestazioni

Scala la tua implementazione

Usa la cache dei prompt

Elabora batch di documenti

Passaggi successivi