Was this page helpful?
Diese Anleitung beschreibt, wie Sie mit Bildern in Claude arbeiten, einschließlich bewährter Methoden, Codebeispielen und zu beachtender Einschränkungen.
Nutzen Sie Claudes Vision-Fähigkeiten über:
Sie können mehrere Bilder in einer einzigen Anfrage einschließen: bis zu 20 für claude.ai und bis zu 600 für API-Anfragen (100 für Modelle mit einem 200k-Token-Kontextfenster). Claude analysiert alle bereitgestellten Bilder bei der Formulierung seiner Antwort. Dies kann hilfreich sein, um Bilder zu vergleichen oder gegenüberzustellen.
Wenn Sie ein Bild einreichen, das größer als 8000x8000 px ist, wird es abgelehnt. Wenn Sie mehr als 20 Bilder in einer API-Anfrage einreichen, gilt ein Limit von 2000x2000 px.
Obwohl die API bis zu 600 Bilder pro Anfrage unterstützt, können Anfragegrößenlimits (32 MB für Standard-Endpunkte; niedriger auf einigen Drittanbieter-Plattformen) zuerst erreicht werden. Bei vielen Bildern sollten Sie das Hochladen mit der Files API in Betracht ziehen und per file_id referenzieren, um die Anfrage-Payloads klein zu halten.
Auch bei Verwendung der Files API können Anfragen mit vielen großen Bildern fehlschlagen, bevor die 600-Bilder-Anzahl erreicht wird. Reduzieren Sie Bildabmessungen oder Dateigrößen (z. B. durch Downsampling) vor dem Hochladen (siehe Bildgröße bewerten).
Für optimale Leistung sollten Sie Bilder vor dem Hochladen verkleinern, wenn sie zu groß sind. Wenn die lange Seite Ihres Bildes mehr als 1568 Pixel beträgt oder Ihr Bild mehr als ~1.600 Token umfasst, wird es zunächst unter Beibehaltung des Seitenverhältnisses verkleinert, bis es innerhalb der Größenlimits liegt.
Wenn Ihr Eingabebild zu groß ist und verkleinert werden muss, erhöht dies die Latenz der Zeit bis zum ersten Token, ohne Vorteile für die Ausgabequalität. Sehr kleine Bilder unter 200 Pixeln auf einer beliebigen Seite können die Ausgabequalität verschlechtern.
Um die Zeit bis zum ersten Token zu verbessern, sollten Sie Bilder auf maximal 1,15 Megapixel (und innerhalb von 1568 Pixeln in beiden Dimensionen) verkleinern.
Hier ist eine Tabelle der maximalen Bildgrößen, die von der API akzeptiert werden und nicht für gängige Seitenverhältnisse verkleinert werden. Mit Claude Sonnet 4.6 verwenden diese Bilder ungefähr 1.600 Token und kosten etwa $4,80/1k Bilder.
| Seitenverhältnis | Bildgröße |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Jedes Bild, das Sie in eine Anfrage an Claude einschließen, zählt zu Ihrer Token-Nutzung. Um die ungefähren Kosten zu berechnen, multiplizieren Sie die ungefähre Anzahl der Bild-Token mit dem Token-Preis des Modells, das Sie verwenden.
Wenn Ihr Bild nicht verkleinert werden muss, können Sie die Anzahl der verwendeten Token mit diesem Algorithmus schätzen: tokens = (Breite px * Höhe px)/750
Hier sind Beispiele für ungefähre Tokenisierung und Kosten für verschiedene Bildgrößen innerhalb der Größenbeschränkungen der API, basierend auf dem Claude Sonnet 4.6 Token-Preis von $3 pro Million Eingabe-Token:
| Bildgröße | Anzahl Token | Kosten / Bild | Kosten / 1k Bilder |
|---|---|---|---|
| 200x200 px (0,04 Megapixel) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px (1 Megapixel) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px (1,19 Megapixel) | ~1590 | ~$0,0048 | ~$4,80 |
Beachten Sie beim Bereitstellen von Bildern für Claude Folgendes für beste Ergebnisse:
Viele der Prompting-Techniken, die gut für textbasierte Interaktionen mit Claude funktionieren, können auch auf bildbasierte Prompts angewendet werden.
Diese Beispiele demonstrieren bewährte Prompt-Strukturen mit Bildern.
Genau wie das Platzieren langer Dokumente vor Ihrer Anfrage die Ergebnisse bei Text-Prompts verbessert, funktioniert Claude am besten, wenn Bilder vor dem Text stehen. Bilder, die nach dem Text platziert oder mit Text interpoliert werden, funktionieren ebenfalls gut, aber wenn Ihr Anwendungsfall es erlaubt, bevorzugen Sie eine Bild-dann-Text-Struktur.
Die folgenden Beispiele zeigen, wie Sie Claudes Vision-Fähigkeiten mit verschiedenen Programmiersprachen und Ansätzen nutzen können. Sie können Bilder auf drei Arten an Claude übergeben:
image-InhaltsblöckenDie base64-Beispiel-Prompts verwenden diese Variablen:
Nachfolgend finden Sie Beispiele, wie Sie Bilder in eine Messages-API-Anfrage mit base64-kodierten Bildern und URL-Referenzen einschließen können:
Für Bilder, die Sie wiederholt verwenden, oder wenn Sie Kodierungsaufwand vermeiden möchten, verwenden Sie die Files API. Laden Sie das Bild einmal hoch und referenzieren Sie dann die zurückgegebene file_id in nachfolgenden Nachrichten, anstatt Base64-Daten erneut zu senden.
In mehrstufigen Konversationen und agentischen Workflows sendet jede Anfrage die
vollständige Konversationshistorie erneut. Wenn Bilder base64-kodiert sind, werden die vollständigen
Bild-Bytes bei jeder Runde in die Nutzlast aufgenommen, was die Anfragegröße und Latenz
erheblich erhöhen kann, wenn die Konversation wächst. Das Hochladen von Bildern in die
Files API und das Referenzieren per file_id hält die Anfrage-Nutzlasten klein,
unabhängig davon, wie viele Bilder sich in der Konversationshistorie ansammeln.
Weitere Beispielcodes und Parameterdetails finden Sie unter Messages API Beispiele.
Obwohl Claudes Bildverständnisfähigkeiten auf dem neuesten Stand sind, gibt es einige Einschränkungen, die zu beachten sind:
Überprüfen und verifizieren Sie Claudes Bildinterpretationen immer sorgfältig, insbesondere bei hochriskanten Anwendungsfällen. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Bildanalyse ohne menschliche Aufsicht erfordern.
Bereit, mit Bildern unter Verwendung von Claude zu entwickeln? Hier sind einige hilfreiche Ressourcen:
Wenn Sie weitere Fragen haben, wenden Sie sich an das Support-Team. Sie können auch der Entwickler-Community beitreten, um sich mit anderen Entwicklern zu vernetzen und Hilfe von Anthropic-Experten zu erhalten.
# Für URL-basierte Bilder können Sie die URL direkt in Ihrer JSON-Anfrage verwenden
# Für base64-kodierte Bilder müssen Sie das Bild zunächst kodieren
# Beispiel, wie man ein Bild in bash zu base64 kodiert:
BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
# Die kodierten Daten können jetzt in Ihren API-Aufrufen verwendet werdencurl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d @- <<EOF
{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "$BASE64_IMAGE_DATA"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}
EOFcurl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'# Laden Sie zunächst Ihr Bild in die Files API hoch
curl -X POST https://api.anthropic.com/v1/files \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-F "[email protected]"
# Verwenden Sie dann die zurückgegebene file_id in Ihrer Nachricht
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: files-api-2025-04-14" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "file",
"file_id": "file_abc123"
}
},
{
"type": "text",
"text": "Describe this image."
}
]
}
]
}'