Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude ermöglicht, mit Desktop-Umgebungen zu interagieren. Dieses Tool bietet:
Während Computer use mit anderen Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude ermöglicht, mit Desktop-Umgebungen zu interagieren. Dieses Tool bietet:
Während Computer use mit anderen Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Computer use ist für die folgenden Claude-Modelle verfügbar:
| Modell | Tool-Version | Beta-Flag |
|---|---|---|
| Claude Opus 4.5 | computer_20251124 | computer-use-2025-11-24 |
| Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
| Claude Sonnet 3.7 (veraltet) | computer_20250124 | computer-use-2025-01-24 |
Claude Opus 4.5 führt die computer_20251124 Tool-Version mit neuen Funktionen ein, einschließlich der Zoom-Aktion zur detaillierten Inspektion von Bildschirmbereichen. Claude 4 Modelle verwenden aktualisierte Tool-Versionen, die für die neue Architektur optimiert sind. Claude Sonnet 3.7 (veraltet) führt zusätzliche Funktionen ein, einschließlich der Thinking-Funktion für mehr Einblick in den Denkprozess des Modells.
Ältere Tool-Versionen sind nicht garantiert abwärtskompatibel mit neueren Modellen. Verwenden Sie immer die Tool-Version, die Ihrer Modellversion entspricht.
Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude ermöglicht, mit Desktop-Umgebungen zu interagieren. Dieses Tool bietet:
Während Computer use mit anderen Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Computer use ist für die folgenden Claude-Modelle verfügbar:
| Modell | Tool-Version | Beta-Flag |
|---|---|---|
| Claude Opus 4.5 | computer_20251124 | computer-use-2025-11-24 |
| Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
| Claude Sonnet 3.7 (veraltet) | computer_20250124 | computer-use-2025-01-24 |
Claude Opus 4.5 führt die computer_20251124 Tool-Version mit neuen Funktionen ein, einschließlich der Zoom-Aktion zur detaillierten Inspektion von Bildschirmbereichen. Claude 4 Modelle verwenden aktualisierte Tool-Versionen, die für die neue Architektur optimiert sind. Claude Sonnet 3.7 (veraltet) führt zusätzliche Funktionen ein, einschließlich der Thinking-Funktion für mehr Einblick in den Denkprozess des Modells.
Ältere Tool-Versionen sind nicht garantiert abwärtskompatibel mit neueren Modellen. Verwenden Sie immer die Tool-Version, die Ihrer Modellversion entspricht.
Computer use ist eine Beta-Funktion mit einzigartigen Risiken, die sich von Standard-API-Funktionen unterscheiden. Diese Risiken sind erhöht, wenn Sie mit dem Internet interagieren. Um Risiken zu minimieren, sollten Sie Vorsichtsmaßnahmen wie folgt in Betracht ziehen:
In einigen Fällen folgt Claude Befehlen, die in Inhalten gefunden werden, auch wenn dies den Anweisungen des Benutzers widerspricht. Beispielsweise können Claude-Anweisungen auf Webseiten oder in Bildern Anweisungen überschreiben oder Claude zu Fehlern führen. Wir empfehlen, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Wir haben das Modell trainiert, um diesen Prompt-Injektionen zu widerstehen, und haben eine zusätzliche Schutzebene hinzugefügt. Wenn Sie unsere Computer-Use-Tools verwenden, führen wir automatisch Klassifizierer auf Ihren Prompts aus, um potenzielle Fälle von Prompt-Injektionen zu kennzeichnen. Wenn diese Klassifizierer potenzielle Prompt-Injektionen in Screenshots identifizieren, lenken sie das Modell automatisch dazu, den Benutzer um Bestätigung zu bitten, bevor die nächste Aktion fortgesetzt wird. Wir erkennen an, dass dieser zusätzliche Schutz nicht ideal für jeden Anwendungsfall ist (z. B. Anwendungsfälle ohne einen Menschen in der Schleife), daher kontaktieren Sie uns bitte hier, wenn Sie sich abmelden und ihn ausschalten möchten.
Wir empfehlen weiterhin, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Informieren Sie schließlich die Endbenutzer über relevante Risiken und erhalten Sie deren Zustimmung, bevor Sie Computer use in Ihren eigenen Produkten aktivieren.
Beginnen Sie schnell mit unserer Computer-Use-Referenzimplementierung, die eine Web-Benutzeroberfläche, einen Docker-Container, Beispiel-Tool-Implementierungen und eine Agent-Schleife enthält.
Hinweis: Die Implementierung wurde aktualisiert, um neue Tools für Claude 4 Modelle und Claude Sonnet 3.7 einzubeziehen. Stellen Sie sicher, dass Sie die neueste Version des Repositorys abrufen, um auf diese neuen Funktionen zuzugreifen.
Bitte verwenden Sie dieses Formular, um Feedback zur Qualität der Modellreaktionen, der API selbst oder der Qualität der Dokumentation zu geben - wir können es kaum erwarten, von Ihnen zu hören!
Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude ermöglicht, mit Desktop-Umgebungen zu interagieren. Dieses Tool bietet:
Während Computer use mit anderen Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Computer use ist für die folgenden Claude-Modelle verfügbar:
| Modell | Tool-Version | Beta-Flag |
|---|---|---|
| Claude Opus 4.5 | computer_20251124 | computer-use-2025-11-24 |
| Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
| Claude Sonnet 3.7 (veraltet) | computer_20250124 | computer-use-2025-01-24 |
Claude Opus 4.5 führt die computer_20251124 Tool-Version mit neuen Funktionen ein, einschließlich der Zoom-Aktion zur detaillierten Inspektion von Bildschirmbereichen. Claude 4 Modelle verwenden aktualisierte Tool-Versionen, die für die neue Architektur optimiert sind. Claude Sonnet 3.7 (veraltet) führt zusätzliche Funktionen ein, einschließlich der Thinking-Funktion für mehr Einblick in den Denkprozess des Modells.
Ältere Tool-Versionen sind nicht garantiert abwärtskompatibel mit neueren Modellen. Verwenden Sie immer die Tool-Version, die Ihrer Modellversion entspricht.
Computer use ist eine Beta-Funktion mit einzigartigen Risiken, die sich von Standard-API-Funktionen unterscheiden. Diese Risiken sind erhöht, wenn Sie mit dem Internet interagieren. Um Risiken zu minimieren, sollten Sie Vorsichtsmaßnahmen wie folgt in Betracht ziehen:
In einigen Fällen folgt Claude Befehlen, die in Inhalten gefunden werden, auch wenn dies den Anweisungen des Benutzers widerspricht. Beispielsweise können Claude-Anweisungen auf Webseiten oder in Bildern Anweisungen überschreiben oder Claude zu Fehlern führen. Wir empfehlen, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Wir haben das Modell trainiert, um diesen Prompt-Injektionen zu widerstehen, und haben eine zusätzliche Schutzebene hinzugefügt. Wenn Sie unsere Computer-Use-Tools verwenden, führen wir automatisch Klassifizierer auf Ihren Prompts aus, um potenzielle Fälle von Prompt-Injektionen zu kennzeichnen. Wenn diese Klassifizierer potenzielle Prompt-Injektionen in Screenshots identifizieren, lenken sie das Modell automatisch dazu, den Benutzer um Bestätigung zu bitten, bevor die nächste Aktion fortgesetzt wird. Wir erkennen an, dass dieser zusätzliche Schutz nicht ideal für jeden Anwendungsfall ist (z. B. Anwendungsfälle ohne einen Menschen in der Schleife), daher kontaktieren Sie uns bitte hier, wenn Sie sich abmelden und ihn ausschalten möchten.
Wir empfehlen weiterhin, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Informieren Sie schließlich die Endbenutzer über relevante Risiken und erhalten Sie deren Zustimmung, bevor Sie Computer use in Ihren eigenen Produkten aktivieren.
Beginnen Sie schnell mit unserer Computer-Use-Referenzimplementierung, die eine Web-Benutzeroberfläche, einen Docker-Container, Beispiel-Tool-Implementierungen und eine Agent-Schleife enthält.
Hinweis: Die Implementierung wurde aktualisiert, um neue Tools für Claude 4 Modelle und Claude Sonnet 3.7 einzubeziehen. Stellen Sie sicher, dass Sie die neueste Version des Repositorys abrufen, um auf diese neuen Funktionen zuzugreifen.
Bitte verwenden Sie dieses Formular, um Feedback zur Qualität der Modellreaktionen, der API selbst oder der Qualität der Dokumentation zu geben - wir können es kaum erwarten, von Ihnen zu hören!
So beginnen Sie mit Computer use:
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-5", # oder ein anderes kompatibles Modell
max_tokens=1024,
tools=[
{
"type": "computer_20250124",
"name": "computer",
"display_width_px": 1024,
"display_height_px": 768,
"display_number": 1,
},
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
},
{
"type": "bash_20250124",
"name": "bash"
}
],
messages=[{"role": "user", "content": "Speichern Sie ein Bild einer Katze auf meinem Desktop."}],
betas=["computer-use-2025-01-24"]
)
print(response)Ein Beta-Header ist nur für das Computer-Use-Tool erforderlich.
Das obige Beispiel zeigt alle drei Tools, die zusammen verwendet werden, was den Beta-Header erfordert, da er das Computer-Use-Tool enthält.
Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude ermöglicht, mit Desktop-Umgebungen zu interagieren. Dieses Tool bietet:
Während Computer use mit anderen Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Computer use ist für die folgenden Claude-Modelle verfügbar:
| Modell | Tool-Version | Beta-Flag |
|---|---|---|
| Claude Opus 4.5 | computer_20251124 | computer-use-2025-11-24 |
| Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
| Claude Sonnet 3.7 (veraltet) | computer_20250124 | computer-use-2025-01-24 |
Claude Opus 4.5 führt die computer_20251124 Tool-Version mit neuen Funktionen ein, einschließlich der Zoom-Aktion zur detaillierten Inspektion von Bildschirmbereichen. Claude 4 Modelle verwenden aktualisierte Tool-Versionen, die für die neue Architektur optimiert sind. Claude Sonnet 3.7 (veraltet) führt zusätzliche Funktionen ein, einschließlich der Thinking-Funktion für mehr Einblick in den Denkprozess des Modells.
Ältere Tool-Versionen sind nicht garantiert abwärtskompatibel mit neueren Modellen. Verwenden Sie immer die Tool-Version, die Ihrer Modellversion entspricht.
Computer use ist eine Beta-Funktion mit einzigartigen Risiken, die sich von Standard-API-Funktionen unterscheiden. Diese Risiken sind erhöht, wenn Sie mit dem Internet interagieren. Um Risiken zu minimieren, sollten Sie Vorsichtsmaßnahmen wie folgt in Betracht ziehen:
In einigen Fällen folgt Claude Befehlen, die in Inhalten gefunden werden, auch wenn dies den Anweisungen des Benutzers widerspricht. Beispielsweise können Claude-Anweisungen auf Webseiten oder in Bildern Anweisungen überschreiben oder Claude zu Fehlern führen. Wir empfehlen, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Wir haben das Modell trainiert, um diesen Prompt-Injektionen zu widerstehen, und haben eine zusätzliche Schutzebene hinzugefügt. Wenn Sie unsere Computer-Use-Tools verwenden, führen wir automatisch Klassifizierer auf Ihren Prompts aus, um potenzielle Fälle von Prompt-Injektionen zu kennzeichnen. Wenn diese Klassifizierer potenzielle Prompt-Injektionen in Screenshots identifizieren, lenken sie das Modell automatisch dazu, den Benutzer um Bestätigung zu bitten, bevor die nächste Aktion fortgesetzt wird. Wir erkennen an, dass dieser zusätzliche Schutz nicht ideal für jeden Anwendungsfall ist (z. B. Anwendungsfälle ohne einen Menschen in der Schleife), daher kontaktieren Sie uns bitte hier, wenn Sie sich abmelden und ihn ausschalten möchten.
Wir empfehlen weiterhin, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Informieren Sie schließlich die Endbenutzer über relevante Risiken und erhalten Sie deren Zustimmung, bevor Sie Computer use in Ihren eigenen Produkten aktivieren.
Beginnen Sie schnell mit unserer Computer-Use-Referenzimplementierung, die eine Web-Benutzeroberfläche, einen Docker-Container, Beispiel-Tool-Implementierungen und eine Agent-Schleife enthält.
Hinweis: Die Implementierung wurde aktualisiert, um neue Tools für Claude 4 Modelle und Claude Sonnet 3.7 einzubeziehen. Stellen Sie sicher, dass Sie die neueste Version des Repositorys abrufen, um auf diese neuen Funktionen zuzugreifen.
Bitte verwenden Sie dieses Formular, um Feedback zur Qualität der Modellreaktionen, der API selbst oder der Qualität der Dokumentation zu geben - wir können es kaum erwarten, von Ihnen zu hören!
1. Stellen Sie Claude das Computer-Use-Tool und eine Benutzeraufforderung zur Verfügung
2. Claude entscheidet sich für die Verwendung des Computer-Use-Tools
stop_reason von tool_use, was Claudes Absicht signalisiert.3. Tool-Eingabe extrahieren, das Tool auf einem Computer auswerten und Ergebnisse zurückgeben
user Nachricht fort, die einen tool_result Inhaltsblock enthält.4. Claude setzt die Verwendung von Computer-Use-Tools fort, bis die Aufgabe abgeschlossen ist
tool_use stop_reason und Sie sollten zu Schritt 3 zurückkehren.Wir bezeichnen die Wiederholung der Schritte 3 und 4 ohne Benutzereingabe als die „Agent-Schleife" - d. h. Claude antwortet mit einer Tool-Use-Anfrage und Ihre Anwendung antwortet Claude mit den Ergebnissen der Auswertung dieser Anfrage.
Claude kann mit Computerumgebungen über das Computer-Use-Tool interagieren, das Screenshot-Funktionen und Maus-/Tastatursteuerung für autonome Desktop-Interaktion bietet.
Computer use ist derzeit in der Beta-Phase und erfordert einen Beta-Header:
"computer-use-2025-11-24" (Claude Opus 4.5)"computer-use-2025-01-24" (Claude 4 Modelle und Claude Sonnet 3.7 (veraltet))Computer use ist eine Beta-Funktion, die Claude die Interaktion mit Desktop-Umgebungen ermöglicht. Dieses Tool bietet:
Während Computer use durch andere Tools wie Bash und Text-Editor für umfassendere Automatisierungs-Workflows erweitert werden kann, bezieht sich Computer use speziell auf die Fähigkeit des Computer-Use-Tools, Desktop-Umgebungen zu sehen und zu steuern.
Computer use ist für die folgenden Claude-Modelle verfügbar:
| Modell | Tool-Version | Beta-Flag |
|---|---|---|
| Claude Opus 4.5 | computer_20251124 | computer-use-2025-11-24 |
| Claude 4 Modelle | computer_20250124 | computer-use-2025-01-24 |
| Claude Sonnet 3.7 (veraltet) | computer_20250124 | computer-use-2025-01-24 |
Claude Opus 4.5 führt die computer_20251124 Tool-Version mit neuen Funktionen ein, einschließlich der Zoom-Aktion zur detaillierten Inspektion von Bildschirmbereichen. Claude 4 Modelle verwenden aktualisierte Tool-Versionen, die für die neue Architektur optimiert sind. Claude Sonnet 3.7 (veraltet) führt zusätzliche Funktionen ein, einschließlich der Thinking-Funktion für mehr Einblick in den Reasoning-Prozess des Modells.
Ältere Tool-Versionen sind nicht garantiert abwärtskompatibel mit neueren Modellen. Verwenden Sie immer die Tool-Version, die Ihrer Modellversion entspricht.
Computer use ist eine Beta-Funktion mit einzigartigen Risiken, die sich von Standard-API-Funktionen unterscheiden. Diese Risiken sind erhöht, wenn mit dem Internet interagiert wird. Um Risiken zu minimieren, sollten Sie Vorsichtsmaßnahmen in Betracht ziehen, wie zum Beispiel:
In einigen Fällen folgt Claude Befehlen, die in Inhalten gefunden werden, auch wenn diese mit den Anweisungen des Benutzers in Konflikt stehen. Zum Beispiel können Claude-Anweisungen auf Webseiten oder in Bildern Anweisungen außer Kraft setzen oder Claude zu Fehlern führen. Wir empfehlen, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Wir haben das Modell trainiert, um diesen Prompt-Injektionen zu widerstehen, und haben eine zusätzliche Schutzebene hinzugefügt. Wenn Sie unsere Computer-Use-Tools verwenden, führen wir automatisch Klassifizierer auf Ihren Prompts aus, um potenzielle Fälle von Prompt-Injektionen zu kennzeichnen. Wenn diese Klassifizierer potenzielle Prompt-Injektionen in Screenshots identifizieren, lenken sie das Modell automatisch dazu, den Benutzer um Bestätigung zu bitten, bevor die nächste Aktion fortgesetzt wird. Wir erkennen an, dass dieser zusätzliche Schutz nicht ideal für jeden Anwendungsfall ist (zum Beispiel Anwendungsfälle ohne einen Menschen in der Schleife), daher können Sie uns kontaktieren, wenn Sie sich abmelden und ihn ausschalten möchten.
Wir empfehlen immer noch, Vorsichtsmaßnahmen zu treffen, um Claude von sensiblen Daten und Aktionen zu isolieren, um Risiken im Zusammenhang mit Prompt-Injection zu vermeiden.
Informieren Sie schließlich die Endbenutzer über relevante Risiken und erhalten Sie deren Zustimmung, bevor Sie Computer use in Ihren eigenen Produkten aktivieren.
Beginnen Sie schnell mit unserer Computer-Use-Referenzimplementierung, die eine Web-Benutzeroberfläche, einen Docker-Container, Beispiel-Tool-Implementierungen und eine Agent-Schleife enthält.
Hinweis: Die Implementierung wurde aktualisiert, um neue Tools für Claude 4 Modelle und Claude Sonnet 3.7 einzubeziehen. Stellen Sie sicher, dass Sie die neueste Version des Repositorys abrufen, um auf diese neuen Funktionen zuzugreifen.
Bitte verwenden Sie dieses Formular, um Feedback zur Qualität der Modellreaktionen, der API selbst oder der Qualität der Dokumentation zu geben - wir können es kaum erwarten, von Ihnen zu hören!
So beginnen Sie mit Computer use:
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-5", # or another compatible model
max_tokens=1024,
tools=[
{
"type": "computer_20250124",
"name": "computer",
"display_width_px": 1024,
"display_height_px": 768,
"display_number": 1,
},
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
},
{
"type": "bash_20250124",
"name": "bash"
}
],
messages=[{"role": "user", "content": "Save a picture of a cat to my desktop."}],
betas=["computer-use-2025-01-24"]
)
print(response)Ein Beta-Header ist nur für das Computer-Use-Tool erforderlich.
Das obige Beispiel zeigt alle drei Tools, die zusammen verwendet werden, was den Beta-Header erfordert, da er das Computer-Use-Tool enthält.
1. Stellen Sie Claude das Computer-Use-Tool und eine Benutzeraufforderung zur Verfügung
2. Claude entscheidet sich, das Computer-Use-Tool zu verwenden
stop_reason von tool_use, was Claudes Absicht signalisiert.3. Tool-Eingabe extrahieren, das Tool auf einem Computer auswerten und Ergebnisse zurückgeben
user-Nachricht fort, die einen tool_result-Inhaltsblock enthält.4. Claude setzt das Aufrufen von Computer-Use-Tools fort, bis die Aufgabe abgeschlossen ist
tool_use stop_reason und Sie sollten zu Schritt 3 zurückkehren.Wir bezeichnen die Wiederholung der Schritte 3 und 4 ohne Benutzereingabe als die „Agent-Schleife" - d. h. Claude antwortet mit einer Tool-Use-Anfrage und Ihre Anwendung antwortet Claude mit den Ergebnissen der Auswertung dieser Anfrage.
Computer use erfordert eine sandboxed Rechenumgebung, in der Claude sicher mit Anwendungen und dem Web interagieren kann. Diese Umgebung umfasst:
Virtueller Display: Ein virtueller X11-Display-Server (mit Xvfb), der die Desktop-Benutzeroberfläche rendert, die Claude durch Screenshots sehen wird und mit Maus-/Tastaturaktionen steuern wird.
Desktop-Umgebung: Eine leichte Benutzeroberfläche mit Window Manager (Mutter) und Panel (Tint2), die auf Linux läuft und eine konsistente grafische Benutzeroberfläche für Claude bietet, mit der interagiert werden kann.
Anwendungen: Vorinstallierte Linux-Anwendungen wie Firefox, LibreOffice, Text-Editoren und Dateimanager, die Claude verwenden kann, um Aufgaben zu erledigen.
Tool-Implementierungen: Integrationscode, der Claudes abstrakte Tool-Anfragen (wie „Maus bewegen" oder „Screenshot machen") in tatsächliche Operationen in der virtuellen Umgebung übersetzt.
Agent-Schleife: Ein Programm, das die Kommunikation zwischen Claude und der Umgebung handhabt, Claudes Aktionen an die Umgebung sendet und die Ergebnisse (Screenshots, Befehlsausgaben) an Claude zurückgibt.
Wenn Sie Computer use verwenden, verbindet sich Claude nicht direkt mit dieser Umgebung. Stattdessen:
Aus Sicherheits- und Isolierungsgründen wird die Referenzimplementierung in einem Docker-Container mit entsprechenden Port-Zuordnungen zum Anzeigen und Interagieren mit der Umgebung ausgeführt.
Wir haben eine Referenzimplementierung erstellt, die alles enthält, was Sie benötigen, um schnell mit Computer use zu beginnen:
Der Kern von Computer use ist die „Agent-Schleife" - ein Zyklus, in dem Claude Tool-Aktionen anfordert, Ihre Anwendung diese ausführt und die Ergebnisse an Claude zurückgibt. Hier ist ein vereinfachtes Beispiel:
async def sampling_loop(
*,
model: str,
messages: list[dict],
api_key: str,
max_tokens: int = 4096,
tool_version: str,
thinking_budget: int | None = None,
max_iterations: int = 10, # Add iteration limit to prevent infinite loops
):
"""
A simple agent loop for Claude computer use interactions.
This function handles the back-and-forth between:
1. Sending user messages to Claude
2. Claude requesting to use tools
3. Your app executing those tools
4. Sending tool results back to Claude
"""
# Set up tools and API parameters
client = Anthropic(api_key=api_key)
beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"
# Configure tools - you should already have these initialized elsewhere
tools = [
{"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
{"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
{"type": f"bash_{tool_version}", "name": "bash"}
]
# Main agent loop (with iteration limit to prevent runaway API costs)
iterations = 0
while True and iterations < max_iterations:
iterations += 1
# Set up optional thinking parameter (for Claude Sonnet 3.7)
thinking = None
if thinking_budget:
thinking = {"type": "enabled", "budget_tokens": thinking_budget}
# Call the Claude API
response = client.beta.messages.create(
model=model,
max_tokens=max_tokens,
messages=messages,
tools=tools,
betas=[beta_flag],
thinking=thinking
)
# Add Claude's response to the conversation history
response_content = response.content
messages.append({"role": "assistant", "content": response_content})
# Check if Claude used any tools
tool_results = []
for block in response_content:
if block.type == "tool_use":
# In a real app, you would execute the tool here
# For example: result = run_tool(block.name, block.input)
result = {"result": "Tool executed successfully"}
# Format the result for Claude
tool_results.append({
"type": "tool_result",
"tool_use_id": block.id,
"content": result
})
# If no tools were used, Claude is done - return the final messages
if not tool_results:
return messages
# Add tool results to messages for the next iteration with Claude
messages.append({"role": "user", "content": tool_results})Die Schleife wird fortgesetzt, bis Claude entweder ohne Anforderung von Tools antwortet (Aufgabenvollendung) oder das maximale Iterationslimit erreicht wird. Diese Schutzvorrichtung verhindert potenzielle Endlosschleifen, die zu unerwarteten API-Kosten führen könnten.
Bei Verwendung des Computer-Use-Tools müssen Sie das entsprechende Beta-Flag für Ihre Modellversion einschließen:
Wir empfehlen, die Referenzimplementierung auszuprobieren, bevor Sie den Rest dieser Dokumentation lesen.
Hier sind einige Tipps, wie Sie die beste Qualität der Ausgaben erhalten:
After each step, take a screenshot and carefully evaluate if you have achieved the right outcome. Explicitly show your thinking: "I have evaluated step X..." If not correct, try again. Only when you confirm a step was executed correctly should you move on to the next one. auffordern.<robot_credentials> an. Die Verwendung von Computer use in Anwendungen, die eine Anmeldung erfordern, erhöht das Risiko schlechter Ergebnisse aufgrund von Prompt-Injection. Bitte lesen Sie unseren Leitfaden zur Minderung von Prompt-Injektionen, bevor Sie dem Modell Anmeldeinformationen geben.Wenn Sie wiederholt auf eine klare Reihe von Problemen stoßen oder im Voraus wissen, welche Aufgaben Claude erledigen muss, verwenden Sie den System-Prompt, um Claude explizite Tipps oder Anweisungen zu geben, wie die Aufgaben erfolgreich erledigt werden.
Wenn eines der von Anthropic definierten Tools über die Claude API angefordert wird, wird ein Computer-Use-spezifischer System-Prompt generiert. Er ähnelt dem Tool-Use-System-Prompt, beginnt aber mit:
You have access to a set of functions you can use to answer the user's question. This includes access to a sandboxed computing environment. You do NOT currently have the ability to inspect files or interact with external resources, except by invoking the below functions.
Wie bei regulärer Tool-Nutzung wird das vom Benutzer bereitgestellte system_prompt-Feld immer noch respektiert und bei der Konstruktion des kombinierten System-Prompts verwendet.
Wir haben eine Referenzimplementierung erstellt, die alles enthält, was Sie benötigen, um schnell mit Computer Use zu beginnen:
Der Kern von Computer Use ist die „Agent-Schleife" – ein Zyklus, in dem Claude Tool-Aktionen anfordert, Ihre Anwendung diese ausführt und die Ergebnisse an Claude zurückgibt. Hier ist ein vereinfachtes Beispiel:
async def sampling_loop(
*,
model: str,
messages: list[dict],
api_key: str,
max_tokens: int = 4096,
tool_version: str,
thinking_budget: int | None = None,
max_iterations: int = 10, # Add iteration limit to prevent infinite loops
):
"""
A simple agent loop for Claude computer use interactions.
This function handles the back-and-forth between:
1. Sending user messages to Claude
2. Claude requesting to use tools
3. Your app executing those tools
4. Sending tool results back to Claude
"""
# Set up tools and API parameters
client = Anthropic(api_key=api_key)
beta_flag = "computer-use-2025-01-24" if "20250124" in tool_version else "computer-use-2024-10-22"
# Configure tools - you should already have these initialized elsewhere
tools = [
{"type": f"computer_{tool_version}", "name": "computer", "display_width_px": 1024, "display_height_px": 768},
{"type": f"text_editor_{tool_version}", "name": "str_replace_editor"},
{"type": f"bash_{tool_version}", "name": "bash"}
]
# Main agent loop (with iteration limit to prevent runaway API costs)
iterations = 0
while True and iterations < max_iterations:
iterations += 1
# Set up optional thinking parameter (for Claude Sonnet 3.7)
thinking = None
if thinking_budget:
thinking = {"type": "enabled", "budget_tokens": thinking_budget}
# Call the Claude API
response = client.beta.messages.create(
model=model,
max_tokens=max_tokens,
messages=messages,
tools=tools,
betas=[beta_flag],
thinking=thinking
)
# Add Claude's response to the conversation history
response_content = response.content
messages.append({"role": "assistant", "content": response_content})
# Check if Claude used any tools
tool_results = []
for block in response_content:
if block.type == "tool_use":
# In a real app, you would execute the tool here
# For example: result = run_tool(block.name, block.input)
result = {"result": "Tool executed successfully"}
# Format the result for Claude
tool_results.append({
"type": "tool_result",
"tool_use_id": block.id,
"content": result
})
# If no tools were used, Claude is done - return the final messages
if not tool_results:
return messages
# Add tool results to messages for the next iteration with Claude
messages.append({"role": "user", "content": tool_results})Die Schleife wird fortgesetzt, bis entweder Claude antwortet, ohne Tools anzufordern (Aufgabenabschluss), oder das maximale Iterationslimit erreicht wird. Diese Sicherheitsmaßnahme verhindert potenzielle Endlosschleifen, die zu unerwarteten API-Kosten führen könnten.
Bei Verwendung des Computer-Use-Tools müssen Sie das entsprechende Beta-Flag für Ihre Modellversion einschließen:
Wir empfehlen, die Referenzimplementierung auszuprobieren, bevor Sie den Rest dieser Dokumentation lesen.
Hier sind einige Tipps, wie Sie die beste Qualität der Ausgaben erreichen:
After each step, take a screenshot and carefully evaluate if you have achieved the right outcome. Explicitly show your thinking: "I have evaluated step X..." If not correct, try again. Only when you confirm a step was executed correctly should you move on to the next one.<robot_credentials> bereit. Die Verwendung von Computer Use in Anwendungen, die eine Anmeldung erfordern, erhöht das Risiko schlechter Ergebnisse aufgrund von Prompt-Injection. Bitte lesen Sie unseren Leitfaden zur Minderung von Prompt-Injektionen, bevor Sie dem Modell Anmeldedaten bereitstellen.Wenn Sie wiederholt auf eine klare Reihe von Problemen stoßen oder im Voraus wissen, welche Aufgaben Claude abschließen muss, verwenden Sie den System-Prompt, um Claude mit expliziten Tipps oder Anweisungen zur erfolgreichen Ausführung der Aufgaben zu versorgen.
Wenn eines der von Anthropic definierten Tools über die Claude API angefordert wird, wird ein Computer-Use-spezifischer System-Prompt generiert. Er ähnelt dem Tool-Use-System-Prompt, beginnt aber mit:
You have access to a set of functions you can use to answer the user's question. This includes access to a sandboxed computing environment. You do NOT currently have the ability to inspect files or interact with external resources, except by invoking the below functions.
Wie bei der regulären Tool-Nutzung wird das vom Benutzer bereitgestellte Feld system_prompt weiterhin respektiert und bei der Konstruktion des kombinierten System-Prompts verwendet.
Das Computer-Use-Tool unterstützt diese Aktionen:
Grundlegende Aktionen (alle Versionen)
[x, y]Erweiterte Aktionen (computer_20250124)
Verfügbar in Claude 4 Modellen und Claude Sonnet 3.7:
Erweiterte Aktionen (computer_20251124)
Verfügbar in Claude Opus 4.5:
computer_20250124enable_zoom: true in der Tool-Definition. Nimmt einen region-Parameter mit Koordinaten [x1, y1, x2, y2] an, die die obere linke und untere rechte Ecke des zu inspizierenden Bereichs definieren.| Parameter | Erforderlich | Beschreibung |
|---|---|---|
type | Ja | Tool-Version (computer_20251124, computer_20250124 oder computer_20241022) |
name | Ja | Muss „computer" sein |
display_width_px | Ja | Anzeigebreite in Pixeln |
display_height_px | Ja | Anzeigehöhe in Pixeln |
display_number | Nein | Anzeigenummer für X11-Umgebungen |
enable_zoom | Nein | Zoom-Aktion aktivieren (computer_20251124 nur). Setzen Sie auf true, um Claude zu ermöglichen, in bestimmte Bildschirmbereiche zu zoomen. Standard: false |
Halten Sie die Anzeigeauflösung bei oder unter 1280x800 (WXGA) für beste Leistung. Höhere Auflösungen können zu Genauigkeitsproblemen führen, da Bilder verkleinert werden.
Wichtig: Das Computer-Use-Tool muss von Ihrer Anwendung explizit ausgeführt werden – Claude kann es nicht direkt ausführen. Sie sind verantwortlich für die Implementierung der Screenshot-Erfassung, Mausbewegungen, Tastatureingaben und anderer Aktionen basierend auf Claudes Anforderungen.
| Parameter | Erforderlich | Beschreibung |
|---|---|---|
type | Ja | Tool-Version (computer_20251124, computer_20250124 oder computer_20241022) |
name | Ja | Muss „computer" sein |
display_width_px | Ja | Anzeigebreite in Pixeln |
display_height_px | Ja | Anzeigehöhe in Pixeln |
display_number | Nein | Anzeigenummer für X11-Umgebungen |
enable_zoom | Nein | Zoom-Aktion aktivieren (computer_20251124 nur). Setzen Sie auf true, um Claude zu ermöglichen, in bestimmte Bildschirmbereiche zu zoomen. Standard: false |
Halten Sie die Anzeigeauflösung bei oder unter 1280x800 (WXGA) für beste Leistung. Höhere Auflösungen können zu Genauigkeitsproblemen führen, da Bilder verkleinert werden.
Wichtig: Das Computer-Use-Tool muss von Ihrer Anwendung explizit ausgeführt werden – Claude kann es nicht direkt ausführen. Sie sind verantwortlich für die Implementierung der Screenshot-Erfassung, Mausbewegungen, Tastatureingaben und anderer Aktionen basierend auf Claudes Anforderungen.
Claude Sonnet 3.7 führte eine neue „Thinking"-Funktion ein, mit der Sie den Denkprozess des Modells sehen können, während es komplexe Aufgaben bearbeitet. Diese Funktion hilft Ihnen zu verstehen, wie Claude ein Problem angeht, und kann besonders wertvoll zum Debuggen oder für Bildungszwecke sein.
Um Thinking zu aktivieren, fügen Sie einen thinking-Parameter zu Ihrer API-Anfrage hinzu:
"thinking": {
"type": "enabled",
"budget_tokens": 1024
}Der budget_tokens-Parameter gibt an, wie viele Token Claude zum Denken verwenden kann. Dies wird von Ihrem Gesamtbudget max_tokens abgezogen.
Wenn Thinking aktiviert ist, gibt Claude seinen Denkprozess als Teil der Antwort zurück, was Ihnen helfen kann:
Hier ist ein Beispiel, wie die Thinking-Ausgabe aussehen könnte:
[Thinking]
I need to save a picture of a cat to the desktop. Let me break this down into steps:
1. First, I'll take a screenshot to see what's on the desktop
2. Then I'll look for a web browser to search for cat images
3. After finding a suitable image, I'll need to save it to the desktop
Let me start by taking a screenshot to see what's available...| Parameter | Erforderlich | Beschreibung |
|---|---|---|
type | Ja | Tool-Version (computer_20251124, computer_20250124 oder computer_20241022) |
name | Ja | Muss „computer" sein |
display_width_px | Ja | Anzeigebreite in Pixeln |
display_height_px | Ja | Anzeigehöhe in Pixeln |
display_number | Nein | Anzeigenummer für X11-Umgebungen |
enable_zoom | Nein | Zoom-Aktion aktivieren (computer_20251124 nur). Setzen Sie auf true, um Claude zu ermöglichen, in bestimmte Bildschirmbereiche zu zoomen. Standard: false |
Halten Sie die Anzeigeauflösung bei oder unter 1280x800 (WXGA) für beste Leistung. Höhere Auflösungen können zu Genauigkeitsproblemen führen, da Bilder verkleinert werden.
Wichtig: Das Computer-Use-Tool muss von Ihrer Anwendung explizit ausgeführt werden – Claude kann es nicht direkt ausführen. Sie sind verantwortlich für die Implementierung der Screenshot-Erfassung, Mausbewegungen, Tastatureingaben und anderer Aktionen basierend auf Claudes Anforderungen.
Claude Sonnet 3.7 führte eine neue „Thinking"-Funktion ein, mit der Sie den Denkprozess des Modells sehen können, während es komplexe Aufgaben bearbeitet. Diese Funktion hilft Ihnen zu verstehen, wie Claude ein Problem angeht, und kann besonders wertvoll zum Debuggen oder für Bildungszwecke sein.
Um Thinking zu aktivieren, fügen Sie einen thinking-Parameter zu Ihrer API-Anfrage hinzu:
"thinking": {
"type": "enabled",
"budget_tokens": 1024
}Der budget_tokens-Parameter gibt an, wie viele Token Claude zum Denken verwenden kann. Dies wird von Ihrem Gesamtbudget max_tokens abgezogen.
Wenn Thinking aktiviert ist, gibt Claude seinen Denkprozess als Teil der Antwort zurück, was Ihnen helfen kann:
Hier ist ein Beispiel, wie die Thinking-Ausgabe aussehen könnte:
[Thinking]
I need to save a picture of a cat to the desktop. Let me break this down into steps:
1. First, I'll take a screenshot to see what's on the desktop
2. Then I'll look for a web browser to search for cat images
3. After finding a suitable image, I'll need to save it to the desktop
Let me start by taking a screenshot to see what's available...Das Computer-Use-Tool kann mit anderen Tools kombiniert werden, um leistungsstärkere Automatisierungs-Workflows zu erstellen. Dies ist besonders nützlich, wenn Sie:
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: computer-use-2025-01-24" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 2000,
"tools": [
{
"type": "computer_20250124",
"name": "computer",
"display_width_px": 1024,
"display_height_px": 768,
"display_number": 1
},
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
},
{
"type": "bash_20250124",
"name": "bash"
},
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"],
"description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
}
},
"required": ["location"]
}
}
],
"messages": [
{
"role": "user",
"content": "Find flights from San Francisco to a place with warmer weather."
}
],
"thinking": {
"type": "enabled",
"budget_tokens": 1024
}
}'| Parameter | Erforderlich | Beschreibung |
|---|---|---|
type | Ja | Werkzeugversion (computer_20251124, computer_20250124 oder computer_20241022) |
name | Ja | Muss "computer" sein |
display_width_px | Ja | Anzeigebreite in Pixeln |
display_height_px | Ja | Anzeigehöhe in Pixeln |
display_number | Nein | Anzeigenummer für X11-Umgebungen |
enable_zoom | Nein | Zoomfunktion aktivieren (computer_20251124 nur). Auf true setzen, um Claude das Zoomen in bestimmte Bildschirmbereiche zu ermöglichen. Standard: false |
Halten Sie die Anzeigeauflösung bei oder unter 1280x800 (WXGA) für optimale Leistung. Höhere Auflösungen können zu Genauigkeitsproblemen führen, da Bilder verkleinert werden.
Wichtig: Das Computernutzungswerkzeug muss von Ihrer Anwendung explizit ausgeführt werden – Claude kann es nicht direkt ausführen. Sie sind verantwortlich für die Implementierung der Screenshot-Erfassung, Mausbewegungen, Tastatureingaben und anderer Aktionen basierend auf Claudes Anfragen.
Claude Sonnet 3.7 führte eine neue "Thinking"-Funktion ein, die es Ihnen ermöglicht, den Denkprozess des Modells zu sehen, während es komplexe Aufgaben bearbeitet. Diese Funktion hilft Ihnen zu verstehen, wie Claude ein Problem angeht, und kann besonders wertvoll zum Debuggen oder für Bildungszwecke sein.
Um Thinking zu aktivieren, fügen Sie einen thinking-Parameter zu Ihrer API-Anfrage hinzu:
"thinking": {
"type": "enabled",
"budget_tokens": 1024
}Der budget_tokens-Parameter gibt an, wie viele Token Claude zum Denken verwenden kann. Dies wird von Ihrem Gesamtbudget max_tokens abgezogen.
Wenn Thinking aktiviert ist, gibt Claude seinen Denkprozess als Teil der Antwort zurück, was Ihnen helfen kann:
Hier ist ein Beispiel, wie die Thinking-Ausgabe aussehen könnte:
[Thinking]
Ich muss ein Bild einer Katze auf dem Desktop speichern. Lassen Sie mich das in Schritte aufteilen:
1. Zuerst mache ich einen Screenshot, um zu sehen, was auf dem Desktop ist
2. Dann suche ich nach einem Webbrowser, um nach Katzenbildern zu suchen
3. Nach dem Finden eines geeigneten Bildes muss ich es auf dem Desktop speichern
Lassen Sie mich mit einem Screenshot beginnen, um zu sehen, was verfügbar ist...Das Computernutzungswerkzeug kann mit anderen Werkzeugen kombiniert werden, um leistungsstärkere Automatisierungs-Workflows zu erstellen. Dies ist besonders nützlich, wenn Sie:
curl https://api.anthropic.com/v1/messages \
-H "content-type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "anthropic-beta: computer-use-2025-01-24" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 2000,
"tools": [
{
"type": "computer_20250124",
"name": "computer",
"display_width_px": 1024,
"display_height_px": 768,
"display_number": 1
},
{
"type": "text_editor_20250728",
"name": "str_replace_based_edit_tool"
},
{
"type": "bash_20250124",
"name": "bash"
},
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"],
"description": "The unit of temperature, either 'celsius' or 'fahrenheit'"
}
},
"required": ["location"]
}
}
],
"messages": [
{
"role": "user",
"content": "Find flights from San Francisco to a place with warmer weather."
}
],
"thinking": {
"type": "enabled",
"budget_tokens": 1024
}
}'Die Referenzimplementierung soll Ihnen den Einstieg in die Computernutzung erleichtern. Sie enthält alle Komponenten, die Claude benötigt, um einen Computer zu nutzen. Sie können jedoch Ihre eigene Umgebung für die Computernutzung erstellen, um Ihre Anforderungen zu erfüllen. Sie benötigen:
tool_use-Ergebnisse mit Ihren Werkzeugimplementierungen ausführtDas Computernutzungswerkzeug wird als schemalose Werkzeug implementiert. Bei der Verwendung dieses Werkzeugs müssen Sie kein Eingabeschema wie bei anderen Werkzeugen bereitstellen; das Schema ist in das Modell von Claude integriert und kann nicht geändert werden.
Richten Sie Ihre Computerumgebung ein
Erstellen Sie eine virtuelle Anzeige oder verbinden Sie sich mit einer vorhandenen Anzeige, mit der Claude interagiert. Dies umfasst normalerweise die Einrichtung von Xvfb (X Virtual Framebuffer) oder ähnlicher Technologie.
Implementieren Sie Action-Handler
Erstellen Sie Funktionen, um jeden Action-Typ zu verarbeiten, den Claude möglicherweise anfordert:
def handle_computer_action(action_type, params):
if action_type == "screenshot":
return capture_screenshot()
elif action_type == "left_click":
x, y = params["coordinate"]
return click_at(x, y)
elif action_type == "type":
return type_text(params["text"])
# ... handle other actionsVerarbeiten Sie Claudes Werkzeugaufrufe
Extrahieren und führen Sie Werkzeugaufrufe aus Claudes Antworten aus:
for content in response.content:
if content.type == "tool_use":
action = content.input["action"]
result = handle_computer_action(action, content.input)
# Return result to Claude
tool_result = {
"type": "tool_result",
"tool_use_id": content.id,
"content": result
}Implementieren Sie die Agent-Schleife
Erstellen Sie eine Schleife, die fortgesetzt wird, bis Claude die Aufgabe abgeschlossen hat:
while True:
response = client.beta.messages.create(...)
# Check if Claude used any tools
tool_results = process_tool_calls(response)
if not tool_results:
# No more tool use, task complete
break
# Continue conversation with tool results
messages.append({"role": "user", "content": tool_results})Bei der Implementierung des Computernutzungswerkzeugs können verschiedene Fehler auftreten. So behandeln Sie diese:
Die Computernutzungsfunktion befindet sich in der Beta-Phase. Obwohl Claudes Fähigkeiten hochmodern sind, sollten Entwickler sich ihrer Einschränkungen bewusst sein:
left_mouse_down, left_mouse_up und neuer Modifiziertastaturunterstützung verbessert. Die Zellenauswahl kann zuverlässiger sein, wenn Sie diese feinen Steuerelemente verwenden und Modifiziertasten mit Klicks kombinieren.Überprüfen und verifizieren Sie immer sorgfältig Claudes Computernutzungsaktionen und Protokolle. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Benutzerinformationen ohne menschliche Überwachung erfordern.
Die Computernutzungsfunktion befindet sich in der Beta-Phase. Obwohl Claudes Fähigkeiten hochmodern sind, sollten Entwickler sich ihrer Einschränkungen bewusst sein:
left_mouse_down, left_mouse_up und neuer Modifiziertastaturunterstützung verbessert. Die Zellenauswahl kann zuverlässiger sein, wenn Sie diese feinen Steuerelemente verwenden und Modifiziertasten mit Klicks kombinieren.Überprüfen und verifizieren Sie immer sorgfältig Claudes Computernutzungsaktionen und Protokolle. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Benutzerinformationen ohne menschliche Überwachung erfordern.
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Die Computernutzungsfunktion befindet sich in der Beta-Phase. Obwohl Claudes Fähigkeiten hochmodern sind, sollten Entwickler sich ihrer Einschränkungen bewusst sein:
left_mouse_down, left_mouse_up und neuer Modifiziertastaturunterstützung verbessert. Die Zellenauswahl kann zuverlässiger sein, wenn Sie diese feinen Steuerelemente verwenden und Modifiziertasten mit Klicks kombinieren.Überprüfen und verifizieren Sie immer sorgfältig Claudes Computernutzungsaktionen und Protokolle. Verwenden Sie Claude nicht für Aufgaben, die perfekte Präzision oder sensible Benutzerinformationen ohne menschliche Überwachung erfordern.
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
Additional token consumption:
If you're also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.