Loading...
    • Erstellen
    • Admin
    • Modelle & Preise
    • Client SDKs
    • API-Referenz
    Search...
    ⌘K
    Erste Schritte
    Einführung in ClaudeSchnellstart
    Entwickeln mit Claude
    FunktionsübersichtVerwendung der Messages APIStoppgründe behandeln
    Modellfähigkeiten
    Erweitertes DenkenAdaptives DenkenAufwandSchnellmodus (Beta: Forschungsvorschau)Strukturierte AusgabenZitateStreaming-NachrichtenStapelverarbeitungSuchergebnisseStreaming-AblehnungenMehrsprachige UnterstützungEmbeddings
    Tools
    ÜbersichtWie Tool-Nutzung funktioniertWeb-SuchtoolWeb-AbruftoolCode-AusführungstoolSpeichertoolBash-ToolComputer-Use-ToolTexteditor-Tool
    Tool-Infrastruktur
    Tool-SucheProgrammatisches Tool-AufrufenFeingranulares Tool-Streaming
    Kontextverwaltung
    KontextfensterKomprimierungKontextbearbeitungPrompt-CachingToken-Zählung
    Mit Dateien arbeiten
    Files APIPDF-UnterstützungBilder und Vision
    Skills
    ÜbersichtSchnellstartBest PracticesSkills für UnternehmenSkills in der API
    MCP
    Remote-MCP-ServerMCP-Connector
    Prompt-Engineering
    ÜbersichtBest Practices für PromptsConsole-Prompting-Tools
    Testen und Evaluieren
    Erfolg definieren und Evaluierungen erstellenDas Evaluierungstool in der Console verwendenLatenz reduzieren
    Leitplanken stärken
    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abmildernPrompt-Lecks reduzieren
    Ressourcen
    Glossar
    Versionshinweise
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Mit Dateien arbeiten

    Vision

    Claudes Vision-Fähigkeiten ermöglichen es, Bilder zu verstehen und zu analysieren, was spannende Möglichkeiten für multimodale Interaktion eröffnet.

    Was this page helpful?

    • So verwenden Sie Vision
    • Vor dem Hochladen
    • Grundlagen und Limits
    • Bildgröße bewerten
    • Bildkosten berechnen
    • Bildqualität sicherstellen
    • Prompt-Beispiele
    • Über die Prompt-Beispiele
    • Base64-kodiertes Bild-Beispiel
    • URL-basiertes Bild-Beispiel
    • Files API Bildbeispiel
    • Einschränkungen
    • FAQ
    • Tiefer in Vision eintauchen

    Diese Anleitung beschreibt, wie Sie mit Bildern in Claude arbeiten, einschließlich bewährter Methoden, Codebeispielen und zu beachtender Einschränkungen.


    So verwenden Sie Vision

    Nutzen Sie Claudes Vision-Fähigkeiten über:

    • claude.ai. Laden Sie ein Bild hoch wie eine Datei, oder ziehen Sie ein Bild direkt in das Chat-Fenster.
    • Die Console Workbench. Eine Schaltfläche zum Hinzufügen von Bildern erscheint oben rechts in jedem Benutzer-Nachrichtenblock.
    • API-Anfrage. Siehe die Beispiele in dieser Anleitung.

    Vor dem Hochladen

    Grundlagen und Limits

    Sie können mehrere Bilder in einer einzigen Anfrage einschließen: bis zu 20 für claude.ai und bis zu 600 für API-Anfragen (100 für Modelle mit einem 200k-Token-Kontextfenster). Claude analysiert alle bereitgestellten Bilder bei der Formulierung seiner Antwort. Dies kann hilfreich sein, um Bilder zu vergleichen oder gegenüberzustellen.

    Wenn Sie ein Bild einreichen, das größer als 8000x8000 px ist, wird es abgelehnt. Wenn Sie mehr als 20 Bilder in einer API-Anfrage einreichen, gilt ein Limit von 2000x2000 px.

    Obwohl die API bis zu 600 Bilder pro Anfrage unterstützt, können Anfragegrößenlimits (32 MB für Standard-Endpunkte; niedriger auf einigen Drittanbieter-Plattformen) zuerst erreicht werden. Bei vielen Bildern sollten Sie das Hochladen mit der Files API in Betracht ziehen und per file_id referenzieren, um die Anfrage-Payloads klein zu halten.

    Auch bei Verwendung der Files API können Anfragen mit vielen großen Bildern fehlschlagen, bevor die 600-Bilder-Anzahl erreicht wird. Reduzieren Sie Bildabmessungen oder Dateigrößen (z. B. durch Downsampling) vor dem Hochladen (siehe Bildgröße bewerten).

    Bildgröße bewerten

    Für optimale Leistung sollten Sie Bilder vor dem Hochladen verkleinern, wenn sie zu groß sind. Wenn die lange Seite Ihres Bildes mehr als 1568 Pixel beträgt oder Ihr Bild mehr als ~1.600 Token umfasst, wird es zunächst unter Beibehaltung des Seitenverhältnisses verkleinert, bis es innerhalb der Größenlimits liegt.

    Wenn Ihr Eingabebild zu groß ist und verkleinert werden muss, erhöht dies die Latenz der Zeit bis zum ersten Token, ohne Vorteile für die Ausgabequalität. Sehr kleine Bilder unter 200 Pixeln auf einer beliebigen Seite können die Ausgabequalität verschlechtern.

    Um die Zeit bis zum ersten Token zu verbessern, sollten Sie Bilder auf maximal 1,15 Megapixel (und innerhalb von 1568 Pixeln in beiden Dimensionen) verkleinern.

    Hier ist eine Tabelle der maximalen Bildgrößen, die von der API akzeptiert werden und nicht für gängige Seitenverhältnisse verkleinert werden. Mit Claude Sonnet 4.6 verwenden diese Bilder ungefähr 1.600 Token und kosten etwa $4,80/1k Bilder.

    SeitenverhältnisBildgröße
    1:11092x1092 px
    3:4951x1268 px
    2:3896x1344 px
    9:16819x1456 px
    1:2784x1568 px

    Bildkosten berechnen

    Jedes Bild, das Sie in eine Anfrage an Claude einschließen, zählt zu Ihrer Token-Nutzung. Um die ungefähren Kosten zu berechnen, multiplizieren Sie die ungefähre Anzahl der Bild-Token mit dem Token-Preis des Modells, das Sie verwenden.

    Wenn Ihr Bild nicht verkleinert werden muss, können Sie die Anzahl der verwendeten Token mit diesem Algorithmus schätzen: tokens = (Breite px * Höhe px)/750

    Hier sind Beispiele für ungefähre Tokenisierung und Kosten für verschiedene Bildgrößen innerhalb der Größenbeschränkungen der API, basierend auf dem Claude Sonnet 4.6 Token-Preis von $3 pro Million Eingabe-Token:

    BildgrößeAnzahl TokenKosten / BildKosten / 1k Bilder
    200x200 px (0,04 Megapixel)~54~$0,00016~$0,16
    1000x1000 px (1 Megapixel)~1334~$0,004~$4,00
    1092x1092 px (1,19 Megapixel)~1590~$0,0048~$4,80

    Bildqualität sicherstellen

    Beachten Sie beim Bereitstellen von Bildern für Claude Folgendes für beste Ergebnisse:

    • Bildformat: Verwenden Sie ein unterstütztes Bildformat: JPEG, PNG, GIF oder WebP.
    • Bildklarheit: Stellen Sie sicher, dass Bilder klar und nicht zu unscharf oder verpixelt sind.
    • Text: Wenn das Bild wichtigen Text enthält, stellen Sie sicher, dass er lesbar und nicht zu klein ist. Vermeiden Sie es, wichtigen visuellen Kontext abzuschneiden, nur um den Text zu vergrößern.

    Prompt-Beispiele

    Viele der Prompting-Techniken, die gut für textbasierte Interaktionen mit Claude funktionieren, können auch auf bildbasierte Prompts angewendet werden.

    Diese Beispiele demonstrieren bewährte Prompt-Strukturen mit Bildern.

    Genau wie das Platzieren langer Dokumente vor Ihrer Anfrage die Ergebnisse bei Text-Prompts verbessert, funktioniert Claude am besten, wenn Bilder vor dem Text stehen. Bilder, die nach dem Text platziert oder mit Text interpoliert werden, funktionieren ebenfalls gut, aber wenn Ihr Anwendungsfall es erlaubt, bevorzugen Sie eine Bild-dann-Text-Struktur.

    Über die Prompt-Beispiele

    Die folgenden Beispiele zeigen, wie Sie Claudes Vision-Fähigkeiten mit verschiedenen Programmiersprachen und Ansätzen nutzen können. Sie können Bilder auf drei Arten an Claude übergeben:

    1. Als base64-kodiertes Bild in image-Inhaltsblöcken
    2. Als URL-Referenz auf ein online gehostetes Bild
    3. Über die Files API (einmal hochladen, mehrfach verwenden)

    Die base64-Beispiel-Prompts verwenden diese Variablen:

    Nachfolgend finden Sie Beispiele, wie Sie Bilder in eine Messages-API-Anfrage mit base64-kodierten Bildern und URL-Referenzen einschließen können:

    Base64-kodiertes Bild-Beispiel

    URL-basiertes Bild-Beispiel

    Files API Bildbeispiel

    Für Bilder, die Sie wiederholt verwenden, oder wenn Sie Kodierungsaufwand vermeiden möchten, verwenden Sie die Files API. Laden Sie das Bild einmal hoch und referenzieren Sie dann die zurückgegebene file_id in nachfolgenden Nachrichten, anstatt Base64-Daten erneut zu senden.

    In mehrstufigen Konversationen und agentischen Workflows sendet jede Anfrage die vollständige Konversationshistorie erneut. Wenn Bilder base64-kodiert sind, werden die vollständigen Bild-Bytes bei jeder Runde in die Nutzlast aufgenommen, was die Anfragegröße und Latenz erheblich erhöhen kann, wenn die Konversation wächst. Das Hochladen von Bildern in die Files API und das Referenzieren per file_id hält die Anfrage-Nutzlasten klein, unabhängig davon, wie viele Bilder sich in der Konversationshistorie ansammeln.

    Weitere Beispielcodes und Parameterdetails finden Sie unter Messages API Beispiele.


    Einschränkungen

    Obwohl Claudes Bildverständnisfähigkeiten auf dem neuesten Stand sind, gibt es einige Einschränkungen, die zu beachten sind:

    • Personenidentifikation: Claude kann nicht verwendet werden, um Personen in Bildern zu benennen, und lehnt dies ab.
    • Genauigkeit: Claude kann halluzinieren oder Fehler machen, wenn es qualitativ minderwertige, gedrehte oder sehr kleine Bilder unter 200 Pixeln interpretiert.
    • Räumliches Denken: Claudes räumliche Denkfähigkeiten sind begrenzt. Es kann Schwierigkeiten mit Aufgaben haben, die eine präzise Lokalisierung oder Layouts erfordern, wie das Ablesen eines analogen Uhrzifferblatts oder die Beschreibung exakter Positionen von Schachfiguren.
    • Zählen: Claude kann ungefähre Zählungen von Objekten in einem Bild liefern, ist aber möglicherweise nicht immer präzise genau, insbesondere bei großen Mengen kleiner Objekte.
    • KI-generierte Bilder: Claude weiß nicht, ob ein Bild KI-generiert ist, und kann falsch liegen, wenn es danach gefragt wird. Verlassen Sie sich nicht darauf, gefälschte oder synthetische Bilder zu erkennen.
    • Unangemessene Inhalte: Claude verarbeitet keine unangemessenen oder expliziten Bilder, die gegen die Acceptable Use Policy verstoßen.
    • Gesundheitsanwendungen: Obwohl Claude allgemeine medizinische Bilder analysieren kann, ist es nicht dafür ausgelegt, komplexe diagnostische Scans wie CTs oder MRTs zu interpretieren. Claudes Ausgaben sollten nicht als Ersatz für professionellen medizinischen Rat oder Diagnose betrachtet werden.

    Überprüfen und verifizieren Sie Claudes Bildinterpretationen immer sorgfältig, insbesondere bei hochriskanten Anwendungsfällen. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Bildanalyse ohne menschliche Aufsicht erfordern.


    FAQ


    Tiefer in Vision eintauchen

    Bereit, mit Bildern unter Verwendung von Claude zu entwickeln? Hier sind einige hilfreiche Ressourcen:

    • Multimodales Cookbook: Dieses Cookbook enthält Tipps zum Einstieg mit Bildern und Best-Practice-Techniken, um die höchste Qualitätsleistung mit Bildern sicherzustellen. Erfahren Sie, wie Sie Claude effektiv mit Bildern prompten können, um Aufgaben wie Interpretieren und Analysieren von Diagrammen oder Extrahieren von Inhalten aus Formularen durchzuführen.
    • API-Referenz: Dokumentation für die Messages API, einschließlich Beispiel-API-Aufrufe mit Bildern.

    Wenn Sie weitere Fragen haben, wenden Sie sich an das Support-Team. Sie können auch der Entwickler-Community beitreten, um sich mit anderen Entwicklern zu vernetzen und Hilfe von Anthropic-Experten zu erhalten.

        # Für URL-basierte Bilder können Sie die URL direkt in Ihrer JSON-Anfrage verwenden
    
        # Für base64-kodierte Bilder müssen Sie das Bild zunächst kodieren
        # Beispiel, wie man ein Bild in bash zu base64 kodiert:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
    
        # Die kodierten Daten können jetzt in Ihren API-Aufrufen verwendet werden
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d @- <<EOF
    {
      "model": "claude-opus-4-6",
      "max_tokens": 1024,
      "messages": [
        {
          "role": "user",
          "content": [
            {
              "type": "image",
              "source": {
                "type": "base64",
                "media_type": "image/jpeg",
                "data": "$BASE64_IMAGE_DATA"
              }
            },
            {
              "type": "text",
              "text": "Describe this image."
            }
          ]
        }
      ]
    }
    EOF
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'
    # Laden Sie zunächst Ihr Bild in die Files API hoch
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # Verwenden Sie dann die zurückgegebene file_id in Ihrer Nachricht
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-opus-4-6",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'