Was this page helpful?
Diese Anleitung beschreibt, wie Sie mit Bildern in Claude arbeiten, einschließlich Best Practices, Code-Beispiele und Einschränkungen, die Sie beachten sollten.
Nutzen Sie Claudes Vision-Funktionen durch:
Sie können mehrere Bilder in einer einzelnen Anfrage einbinden: bis zu 20 für claude.ai und bis zu 600 für API-Anfragen (100 für Modelle mit einem 200k-Token-Kontextfenster). Claude analysiert alle bereitgestellten Bilder bei der Formulierung seiner Antwort. Dies kann hilfreich sein, um Bilder zu vergleichen oder gegenüberzustellen.
Wenn Sie ein Bild größer als 8000x8000 px einreichen, wird es abgelehnt. Wenn Sie mehr als 20 Bilder in einer API-Anfrage einreichen, beträgt dieses Limit 2000x2000 px.
Während die API bis zu 600 Bilder pro Anfrage unterstützt, können Request-Größenlimits (32 MB für Standard-Endpunkte; niedriger auf einigen Drittanbieter-Plattformen) zuerst erreicht werden. Für viele Bilder sollten Sie das Files API zum Hochladen verwenden und nach file_id referenzieren, um Request-Payloads klein zu halten.
Selbst bei Verwendung der Files API können Anfragen mit vielen großen Bildern fehlschlagen, bevor die 600-Bild-Grenze erreicht wird. Reduzieren Sie die Bilddimensionen oder Dateigröße (z. B. durch Downsampling), bevor Sie hochladen (siehe Bilddimension evaluieren).
Um die Latenz zu minimieren, ohne die Ausgabequalität zu beeinträchtigen, ändern Sie die Größe von Bildern vor dem Hochladen, wenn sie zu groß sind. Bei Claude Opus 4.6, Claude Sonnet 4.6 und früheren Modellen wird das Bild, wenn die lange Kante Ihres Bildes mehr als 1568 Pixel beträgt oder Ihr Bild mehr als ~1.600 Token ist, zuerst herunterskaliert, wobei das Seitenverhältnis beibehalten wird, bis es innerhalb der Größenlimits liegt.
Wenn Ihr Eingabebild zu groß ist und neu skaliert werden muss, erhöht dies die Latenz von time-to-first-token, ohne dass die Ausgabequalität verbessert wird. Sehr kleine Bilder unter 200 Pixeln auf einer beliebigen Kante können die Ausgabequalität beeinträchtigen.
Für Modelle vor Claude Opus 4.7, um time-to-first-token zu verbessern, sollten Sie erwägen, Bilder auf nicht mehr als 1,15 Megapixel zu ändern (und innerhalb von 1568 Pixeln in beiden Dimensionen). Für Claude Opus 4.7 siehe Hochauflösungs-Bildunterstützung unten.
Claude Opus 4.7 ist das erste Claude-Modell mit Hochauflösungs-Bildunterstützung. Die maximale Bildauflösung beträgt 2576 Pixel auf der langen Kante (gegenüber 1568 px bei früheren Modellen). Dies eröffnet Leistungsgewinne bei Vision-intensiven Workloads und ist besonders wertvoll für Computer Use, Screenshot-Verständnis und Dokumentenanalyse.
Hochauflösungs-Unterstützung ist automatisch auf Claude Opus 4.7 und erfordert keinen Beta-Header oder Client-seitiges Opt-in.
Token-Kosten: Vollauflösungsbilder auf Claude Opus 4.7 können bis zu ungefähr 3x mehr Bild-Token verwenden als bei früheren Modellen (bis zu 4784 Token pro Bild, verglichen mit der vorherigen Obergrenze von ungefähr ~1.600 Token pro Bild). Wenn Sie die zusätzliche Klarheit nicht benötigen, downsampling Sie Bilder vor dem Senden, um Token-Kosten zu kontrollieren.
Koordinaten-Mathematik: Bei Claude Opus 4.7 sind Zeige- und Bounding-Box-Koordinaten, die vom Modell zurückgegeben werden, 1
mit tatsächlichen Bildpixeln, daher ist keine Skalierungsfaktor-Konvertierung erforderlich. Dies vereinfacht Computer Use, Annotation und Lokalisierungs-Workflows.Hier ist eine Tabelle der maximalen Bildgrößen, die von der API akzeptiert werden und nicht für gängige Seitenverhältnisse neu skaliert werden. Mit Claude Sonnet 4.6 verwenden diese Bilder ungefähr 1.600 Token und etwa $4,80/1k Bilder.
| Seitenverhältnis | Bildgröße |
|---|---|
| 1:1 | 1092x1092 px |
| 3:4 | 951x1268 px |
| 2:3 | 896x1344 px |
| 9:16 | 819x1456 px |
| 1:2 | 784x1568 px |
Jedes Bild, das Sie in eine Anfrage an Claude einbinden, zählt zu Ihrer Token-Nutzung. Um die ungefähren Kosten zu berechnen, multiplizieren Sie die ungefähre Anzahl der Bild-Token mit dem Pro-Token-Preis des Modells, das Sie verwenden.
Wenn Ihr Bild nicht neu skaliert werden muss, können Sie die Anzahl der verwendeten Token durch diesen Algorithmus schätzen: tokens = (width px * height px)/750
Hier sind Beispiele für ungefähre Tokenisierung und Kosten für verschiedene Bildgrößen innerhalb der API-Größenlimits basierend auf Claude Sonnet 4.6 Pro-Token-Preis von $3 pro Million Input-Token:
| Bildgröße | Anzahl Token | Kosten / Bild | Kosten / 1k Bilder |
|---|---|---|---|
| 200x200 px(0,04 Megapixel) | ~54 | ~$0,00016 | ~$0,16 |
| 1000x1000 px(1 Megapixel) | ~1334 | ~$0,004 | ~$4,00 |
| 1092x1092 px(1,19 Megapixel) | ~1590 | ~$0,0048 | ~$4,80 |
Wenn Sie Bilder an Claude bereitstellen, beachten Sie Folgendes für beste Ergebnisse:
Viele der Prompting-Techniken, die gut für textbasierte Interaktionen mit Claude funktionieren, können auch auf bildbasierte Prompts angewendet werden.
Diese Beispiele demonstrieren Best-Practice-Prompt-Strukturen mit Bildern.
Genauso wie das Platzieren langer Dokumente vor Ihrer Abfrage die Ergebnisse bei Text-Prompts verbessert, funktioniert Claude am besten, wenn Bilder vor Text kommen. Bilder, die nach Text platziert oder mit Text interpoliert werden, funktionieren immer noch gut, aber wenn Ihr Use-Case es erlaubt, bevorzugen Sie eine Bild-dann-Text-Struktur.
Die folgenden Beispiele zeigen, wie Sie Claudes Vision-Funktionen mit verschiedenen Programmiersprachen und Ansätzen verwenden. Sie können Bilder an Claude auf drei Arten bereitstellen:
image Content-BlöckenDie Base64-Beispiel-Prompts verwenden diese Variablen:
Nachfolgend finden Sie Beispiele, wie Sie Bilder in eine Messages API-Anfrage mit Base64-codierten Bildern und URL-Referenzen einbinden:
Für Bilder, die Sie wiederholt verwenden oder wenn Sie Encoding-Overhead vermeiden möchten, verwenden Sie die Files API. Laden Sie das Bild einmal hoch und verweisen Sie dann in nachfolgenden Nachrichten auf die zurückgegebene file_id, anstatt Base64-Daten erneut zu senden.
In mehrteiligen Konversationen und agentengesteuerten Workflows sendet jede Anfrage
den vollständigen Konversationsverlauf erneut. Wenn Bilder Base64-codiert sind, sind die vollständigen
Bildbytes in der Nutzlast bei jedem Durchgang enthalten, was die Anfragegröße
und Latenz erheblich erhöhen kann, wenn die Konversation wächst. Das Hochladen von Bildern zur
Files API und das Verweisen auf sie über file_id hält Anfragenutzlasten klein,
unabhängig davon, wie viele Bilder sich im Konversationsverlauf ansammeln.
Weitere Beispielcodes und Parameterdetails finden Sie unter Messages API-Beispiele.
Obwohl Claudes Bildverständnisfähigkeiten hochmodern sind, gibt es einige Einschränkungen, die Sie beachten sollten:
Überprüfen und verifizieren Sie Claudes Bildinterpretationen immer sorgfältig, besonders bei hochriskanten Anwendungsfällen. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision erfordern, oder für sensible Bildanalysen ohne menschliche Aufsicht.
Bereit, mit Bildern mit Claude zu bauen? Hier sind einige hilfreiche Ressourcen:
Wenn Sie weitere Fragen haben, wenden Sie sich an das Support-Team. Sie können auch der Entwickler-Community beitreten, um sich mit anderen Kreativen zu verbinden und Hilfe von Anthropic-Experten zu erhalten.
import base64
import httpx
# Für Base64-codierte Bilder
image1_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
image1_media_type = "image/jpeg"
image1_data = base64.standard_b64encode(httpx.get(image1_url).content).decode("utf-8")
image2_url = "https://upload.wikimedia.org/wikipedia/commons/b/b5/Iridescent.green.sweat.bee1.jpg"
image2_media_type = "image/jpeg"
image2_data = base64.standard_b64encode(httpx.get(image2_url).content).decode("utf-8")
# Für URL-basierte Bilder können Sie die URLs direkt in Ihren Anfragen verwendenimage1_data = "iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAIAAACQd1PeAAAADElEQVR4nGP4z8AAAAMBAQDJ/pLvAAAAAElFTkSuQmCC"
image1_media_type = "image/png"
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": image1_media_type,
"data": image1_data,
},
},
{"type": "text", "text": "Describe this image."},
],
}
],
)
print(message)client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "url",
"url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg",
},
},
{"type": "text", "text": "Describe this image."},
],
}
],
)
print(message)client = anthropic.Anthropic()
# Laden Sie die Bilddatei hoch
with open("image.jpg", "rb") as f:
file_upload = client.beta.files.upload(file=("image.jpg", f, "image/jpeg"))
# Verwenden Sie die hochgeladene Datei in einer Nachricht
message = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
betas=["files-api-2025-04-14"],
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {"type": "file", "file_id": file_upload.id},
},
{"type": "text", "text": "Describe this image."},
],
}
],
)
print(message.content)