Loading...
    • Entwicklerleitfaden
    • API-Referenz
    • MCP
    • Ressourcen
    • Versionshinweise
    Search...
    ⌘K

    Erste Schritte

    Einführung in ClaudeSchnellstart

    Modelle & Preise

    ModellübersichtEin Modell wählenWas ist neu in Claude 4.5Migration zu Claude 4.5ModellabschreibungenPreise

    Mit Claude entwickeln

    FunktionsübersichtArbeiten mit der Messages APIKontextfensterBest Practices für Prompting

    Funktionen

    Prompt-CachingKontextbearbeitungErweitertes DenkenStreaming-NachrichtenBatch-VerarbeitungZitateMehrsprachige UnterstützungToken-ZählungEmbeddingsVisionPDF-UnterstützungFiles APISuchergebnisseGoogle Sheets Add-on

    Werkzeuge

    ÜbersichtWie man Tool-Nutzung implementiertToken-effiziente WerkzeugnutzungFeinkörniges Tool-StreamingBash-ToolCode-AusführungstoolComputer-Use-ToolText-Editor-ToolWeb-Abruf-ToolWeb-SuchwerkzeugMemory-Tool

    Agent-Fähigkeiten

    ÜbersichtErste Schritte mit Agent Skills in der APIBest Practices für die Skill-ErstellungSkills verwenden

    Agent SDK

    ÜbersichtAgent SDK-Referenz - TypeScriptPython SDK

    Leitfäden

    Streaming-EingabeBerechtigungen verwaltenSession-VerwaltungHosting des Agent SDKSystem-Prompts modifizierenMCP im SDKBenutzerdefinierte ToolsSubagenten im SDKSlash-Befehle im SDKAgent Skills im SDKKosten und Nutzung verfolgenTodo-ListenPlugins im SDK

    MCP in der API

    MCP-ConnectorRemote MCP-Server

    Claude auf Drittanbieter-Plattformen

    Amazon BedrockVertex AI

    Prompt-Engineering

    ÜbersichtPrompt-GeneratorPrompt-Vorlagen verwendenPrompt-VerbessererSei klar und direktBeispiele verwenden (Multishot-Prompting) um Claudes Verhalten zu steuernClaude denken lassen (CoT)XML-Tags verwendenClaude eine Rolle geben (System-Prompts)Vorausfüllen von Claudes AntwortKomplexe Prompts verkettenTipps für langen KontextTipps für erweiterte Denkprozesse

    Testen & bewerten

    Erfolgskriterien definierenTestfälle entwickelnVerwendung des Evaluierungs-ToolsLatenz reduzieren

    Schutzmaßnahmen verstärken

    Halluzinationen reduzierenAusgabekonsistenz erhöhenJailbreaks abwehrenhandle-streaming-refusalsPrompt-Leaks reduzierenClaude im Charakter halten

    Verwaltung und Überwachung

    Admin API ÜbersichtNutzungs- und Kosten-APIClaude Code Analytics API
    Console
    Funktionen

    Vision

    Die Claude 3 und 4 Modellfamilien verfügen über neue Visionsfähigkeiten, die es Claude ermöglichen, Bilder zu verstehen und zu analysieren, was aufregende Möglichkeiten für multimodale Interaktion eröffnet.

    Diese Anleitung beschreibt, wie Sie mit Bildern in Claude arbeiten, einschließlich Best Practices, Codebeispiele und Einschränkungen, die Sie beachten sollten.


    So verwenden Sie Vision

    Nutzen Sie Claudes Visionsfähigkeiten über:

    • claude.ai. Laden Sie ein Bild wie eine Datei hoch, oder ziehen Sie ein Bild direkt in das Chat-Fenster.
    • Die Console Workbench. Wenn Sie ein Modell auswählen, das Bilder akzeptiert (nur Claude 3 und 4 Modelle), wird oben rechts in jedem Benutzernachrichtenblock eine Schaltfläche zum Hinzufügen von Bildern angezeigt.
    • API-Anfrage. Siehe die Beispiele in dieser Anleitung.

    Vor dem Hochladen

    Grundlagen und Limits

    Sie können bis zu 20 Bilder in einer einzelnen Anfrage einbinden (bis zu 20 für claude.ai und 100 für API-Anfragen). Claude wird alle bereitgestellten Bilder analysieren, wenn es seine Antwort formuliert. Dies kann hilfreich sein, um Bilder zu vergleichen oder gegenüberzustellen.

    Wenn Sie ein Bild größer als 8000x8000 px einreichen, wird es abgelehnt. Wenn Sie mehr als 20 Bilder in einer API-Anfrage einreichen, beträgt dieses Limit 2000x2000 px.

    Während die API 100 Bilder pro Anfrage unterstützt, gibt es ein 32-MB-Anfragegrößenlimit für Standard-Endpunkte.

    Bildgröße bewerten

    Für optimale Leistung empfehlen wir, Bilder vor dem Hochladen zu verkleinern, wenn sie zu groß sind. Wenn die lange Kante Ihres Bildes mehr als 1568 Pixel beträgt oder Ihr Bild mehr als ~1.600 Token hat, wird es zunächst verkleinert, wobei das Seitenverhältnis beibehalten wird, bis es innerhalb der Größenlimits liegt.

    Wenn Ihr Eingabebild zu groß ist und verkleinert werden muss, erhöht dies die Latenz von time-to-first-token, ohne Ihnen zusätzliche Modellleistung zu geben. Sehr kleine Bilder unter 200 Pixeln auf einer beliebigen Kante können die Leistung beeinträchtigen.

    Um time-to-first-token zu verbessern, empfehlen wir, Bilder auf nicht mehr als 1,15 Megapixel zu verkleinern (und innerhalb von 1568 Pixeln in beiden Dimensionen).

    Hier ist eine Tabelle der maximalen Bildgrößen, die von unserer API akzeptiert werden und nicht für gängige Seitenverhältnisse verkleinert werden. Mit dem Claude Sonnet 3.7 Modell verwenden diese Bilder ungefähr 1.600 Token und kosten etwa 4,80 $/1K Bilder.

    SeitenverhältnisBildgröße
    1
    1092x1092 px
    3
    951x1268 px
    2
    896x1344 px
    9
    819x1456 px
    1
    784x1568 px

    Bildkosten berechnen

    Jedes Bild, das Sie in eine Anfrage an Claude einbinden, zählt zu Ihrer Token-Nutzung. Um die ungefähren Kosten zu berechnen, multiplizieren Sie die ungefähre Anzahl der Bild-Token mit dem Pro-Token-Preis des Modells, das Sie verwenden.

    Wenn Ihr Bild nicht verkleinert werden muss, können Sie die Anzahl der verwendeten Token durch diesen Algorithmus schätzen: tokens = (width px * height px)/750

    Hier sind Beispiele für ungefähre Tokenisierung und Kosten für verschiedene Bildgrößen innerhalb der Größenlimits unserer API basierend auf Claude Sonnet 3.7 Pro-Token-Preis von 3 $ pro Million Eingabe-Token:

    BildgrößeAnzahl TokenKosten / BildKosten / 1K Bilder
    200x200 px(0,04 Megapixel)~54~$0,00016~$0,16
    1000x1000 px(1 Megapixel)~1334~$0,004~$4,00
    1092x1092 px(1,19 Megapixel)~1590~$0,0048~$4,80

    Bildqualität sicherstellen

    Beachten Sie beim Bereitstellen von Bildern für Claude Folgendes, um die besten Ergebnisse zu erzielen:

    • Bildformat: Verwenden Sie ein unterstütztes Bildformat: JPEG, PNG, GIF oder WebP.
    • Bildklarheit: Stellen Sie sicher, dass Bilder klar sind und nicht zu verschwommen oder pixelig.
    • Text: Wenn das Bild wichtigen Text enthält, stellen Sie sicher, dass er lesbar ist und nicht zu klein. Vermeiden Sie es, wichtigen visuellen Kontext auszuschneiden, nur um den Text zu vergrößern.

    Prompt-Beispiele

    Viele der Prompt-Techniken, die gut für textbasierte Interaktionen mit Claude funktionieren, können auch auf bildbasierte Prompts angewendet werden.

    Diese Beispiele zeigen Best-Practice-Prompt-Strukturen mit Bildern.

    Genau wie bei der Platzierung von Dokument-Abfragen funktioniert Claude am besten, wenn Bilder vor Text kommen. Bilder, die nach Text platziert oder mit Text vermischt werden, funktionieren immer noch gut, aber wenn Ihr Anwendungsfall es zulässt, empfehlen wir eine Bild-dann-Text- Struktur.

    Über die Prompt-Beispiele

    Die folgenden Beispiele zeigen, wie Sie Claudes Visionsfähigkeiten mit verschiedenen Programmiersprachen und Ansätzen nutzen. Sie können Bilder auf drei Arten an Claude bereitstellen:

    1. Als base64-kodiertes Bild in image Inhaltsblöcken
    2. Als URL-Referenz zu einem online gehosteten Bild
    3. Mit der Files API (einmal hochladen, mehrfach verwenden)

    Die base64-Beispiel-Prompts verwenden diese Variablen:

    Shell
        # Für URL-basierte Bilder können Sie die URL direkt in Ihrer JSON-Anfrage verwenden
        
        # Für base64-kodierte Bilder müssen Sie das Bild zunächst kodieren
        # Beispiel für die Kodierung eines Bildes zu base64 in bash:
        BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
        
        # Die kodierten Daten können jetzt in Ihren API-Aufrufen verwendet werden
    Python
    import base64
    import httpx
    
    # Für base64-kodierte Bilder
    image1_url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
    image1_media_type = "image/jpeg"
    image1_data = base64.standard_b64encode(httpx.get(image1_url).content).decode("utf-8")
    
    image2_url = "https://upload.wikimedia.org/wikipedia/commons/b/b5/Iridescent.green.sweat.bee1.jpg"
    image2_media_type = "image/jpeg"
    image2_data = base64.standard_b64encode(httpx.get(image2_url).content).decode("utf-8")
    
    # Für URL-basierte Bilder können Sie die URLs direkt in Ihren Anfragen verwenden
    TypeScript
    import axios from 'axios';
    
    // Für base64-kodierte Bilder
    async function getBase64Image(url: string): Promise<string> {
      const response = await axios.get(url, { responseType: 'arraybuffer' });
      return Buffer.from(response.data, 'binary').toString('base64');
    }
    
    // Verwendung
    async function prepareImages() {
      const imageData = await getBase64Image('https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg');
      // Jetzt können Sie imageData in Ihren API-Aufrufen verwenden
    }
    
    // Für URL-basierte Bilder können Sie die URLs direkt in Ihren Anfragen verwenden
    Java
    import java.io.IOException;
    import java.util.Base64;
    import java.io.InputStream;
    import java.net.URL;
    
    public class ImageHandlingExample {
    
        public static void main(String[] args) throws IOException, InterruptedException {
            // Für base64-kodierte Bilder
            String image1Url = "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg";
            String image1MediaType = "image/jpeg";
            String image1Data = downloadAndEncodeImage(image1Url);
    
            String image2Url = "https://upload.wikimedia.org/wikipedia/commons/b/b5/Iridescent.green.sweat.bee1.jpg";
            String image2MediaType = "image/jpeg";
            String image2Data = downloadAndEncodeImage(image2Url);
    
            // Für URL-basierte Bilder können Sie die URLs direkt in Ihren Anfragen verwenden
        }
    
        private static String downloadAndEncodeImage(String imageUrl) throws IOException {
            try (InputStream inputStream = new URL(imageUrl).openStream()) {
                return Base64.getEncoder().encodeToString(inputStream.readAllBytes());
            }
        }
    
    }

    Nachfolgend finden Sie Beispiele für die Einbindung von Bildern in eine Messages API-Anfrage mit base64-kodierten Bildern und URL-Referenzen:

    Base64-kodiertes Bildbeispiel

    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "base64",
                  "media_type": "image/jpeg",
                  "data": "'"$BASE64_IMAGE_DATA"'"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'

    URL-basiertes Bildbeispiel

    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "url",
                  "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'

    Files API Bildbeispiel

    Für Bilder, die Sie wiederholt verwenden, oder wenn Sie Kodierungsaufwand vermeiden möchten, verwenden Sie die Files API:

    # Laden Sie zunächst Ihr Bild in die Files API hoch
    curl -X POST https://api.anthropic.com/v1/files \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -F "[email protected]"
    
    # Verwenden Sie dann die zurückgegebene file_id in Ihrer Nachricht
    curl https://api.anthropic.com/v1/messages \
      -H "x-api-key: $ANTHROPIC_API_KEY" \
      -H "anthropic-version: 2023-06-01" \
      -H "anthropic-beta: files-api-2025-04-14" \
      -H "content-type: application/json" \
      -d '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 1024,
        "messages": [
          {
            "role": "user",
            "content": [
              {
                "type": "image",
                "source": {
                  "type": "file",
                  "file_id": "file_abc123"
                }
              },
              {
                "type": "text",
                "text": "Describe this image."
              }
            ]
          }
        ]
      }'

    Siehe Messages API Beispiele für weitere Beispielcode und Parameterdetails.


    Einschränkungen

    Während Claudes Bildverständnisfähigkeiten hochmodern sind, gibt es einige Einschränkungen, die Sie beachten sollten:

    • Personenerkennung: Claude kann nicht verwendet werden, um Personen in Bildern zu identifizieren (d. h. zu benennen), und wird dies ablehnen.
    • Genauigkeit: Claude kann halluzinieren oder Fehler machen, wenn er Bilder mit niedriger Qualität, gedrehte oder sehr kleine Bilder unter 200 Pixeln interpretiert.
    • Räumliches Denken: Claudes räumliche Denkfähigkeiten sind begrenzt. Es kann bei Aufgaben, die präzise Lokalisierung oder Layouts erfordern, wie das Lesen eines analogen Ziffernblatts oder die Beschreibung exakter Positionen von Schachfiguren, Schwierigkeiten haben.
    • Zählen: Claude kann ungefähre Zählungen von Objekten in einem Bild geben, ist aber möglicherweise nicht immer genau, besonders bei großen Mengen kleiner Objekte.
    • KI-generierte Bilder: Claude weiß nicht, ob ein Bild KI-generiert ist, und kann falsch liegen, wenn er gefragt wird. Verlassen Sie sich nicht darauf, um gefälschte oder synthetische Bilder zu erkennen.
    • Unangemessene Inhalte: Claude verarbeitet keine unangemessenen oder expliziten Bilder, die gegen unsere Acceptable Use Policy verstoßen.
    • Gesundheitsanwendungen: Während Claude allgemeine medizinische Bilder analysieren kann, ist es nicht dafür ausgelegt, komplexe diagnostische Scans wie CTs oder MRTs zu interpretieren. Claudes Ausgaben sollten nicht als Ersatz für professionelle medizinische Beratung oder Diagnose angesehen werden.

    Überprüfen und verifizieren Sie immer sorgfältig Claudes Bildinterpretationen, besonders bei hochriskanten Anwendungsfällen. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Bildanalyse ohne menschliche Aufsicht erfordern.


    Häufig gestellte Fragen


    Tiefer in Vision eintauchen

    Bereit, mit Bildern mit Claude zu bauen? Hier sind einige hilfreiche Ressourcen:

    • Multimodales Kochbuch: Dieses Kochbuch hat Tipps zum Einstieg in Bilder und Best-Practice-Techniken, um die höchste Qualitätsleistung mit Bildern zu gewährleisten. Sehen Sie, wie Sie Claude effektiv mit Bildern auffordern können, um Aufgaben wie Interpretation und Analyse von Diagrammen oder Extrahieren von Inhalten aus Formularen durchzuführen.
    • API-Referenz: Besuchen Sie unsere Dokumentation für die Messages API, einschließlich Beispiel API-Aufrufe mit Bildern.

    Wenn Sie weitere Fragen haben, wenden Sie sich gerne an unser Support-Team. Sie können auch unserer Entwickler-Community beitreten, um mit anderen Kreativen in Kontakt zu treten und Hilfe von Anthropic-Experten zu erhalten.

    • So verwenden Sie Vision
    • Vor dem Hochladen
    • Grundlagen und Limits
    • Bildgröße bewerten
    • Bildkosten berechnen
    • Bildqualität sicherstellen
    • Prompt-Beispiele
    • Über die Prompt-Beispiele
    • Base64-kodiertes Bildbeispiel
    • URL-basiertes Bildbeispiel
    • Files API Bildbeispiel
    • Einschränkungen
    • Häufig gestellte Fragen
    • Tiefer in Vision eintauchen
    © 2025 ANTHROPIC PBC

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy

    Products

    • Claude
    • Claude Code
    • Max plan
    • Team plan
    • Enterprise plan
    • Download app
    • Pricing
    • Log in

    Features

    • Claude and Slack
    • Claude in Excel

    Models

    • Opus
    • Sonnet
    • Haiku

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Claude Developer Platform

    • Overview
    • Developer docs
    • Pricing
    • Amazon Bedrock
    • Google Cloud’s Vertex AI
    • Console login

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Help and security

    • Availability
    • Status
    • Support center

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    © 2025 ANTHROPIC PBC