Claude Platform Docs
  • Messages
  • Managed Agents
  • 관리자

Search...
⌘K
첫 단계
Claude 소개빠른 시작
Claude로 빌드하기
기능 개요Messages API 사용하기중지 이유 및 폴백거부 및 폴백폴백 크레딧
모델 기능
확장 사고적응형 사고Effort작업 예산 (베타)고속 모드 (리서치 프리뷰)구조화된 출력인용스트리밍 메시지배치 처리검색 결과스트리밍 거부다국어 지원임베딩
도구
개요도구 사용 작동 방식튜토리얼: 도구 사용 에이전트 빌드하기도구 정의도구 호출 처리병렬 도구 사용Tool Runner (SDK)엄격한 도구 사용프롬프트 캐싱과 도구 사용서버 도구문제 해결웹 검색 도구웹 가져오기 도구코드 실행 도구어드바이저 도구메모리 도구Bash 도구컴퓨터 사용 도구텍스트 편집기 도구
도구 인프라
도구 레퍼런스도구 컨텍스트 관리도구 조합도구 검색프로그래밍 방식 도구 호출세분화된 도구 스트리밍
컨텍스트 관리
컨텍스트 윈도우압축컨텍스트 편집프롬프트 캐싱대화 중 시스템 메시지오케스트레이션 모드 빌드하기캐시 진단 (베타)토큰 계산
파일 작업
Files APIPDF 지원이미지 및 비전
스킬
개요빠른 시작모범 사례엔터프라이즈용 스킬API의 스킬
MCP
원격 MCP 서버MCP 커넥터
클라우드 플랫폼의 Claude
Amazon BedrockAmazon Bedrock (레거시)AWS의 Claude PlatformMicrosoft FoundryVertex AI

Log in
컴퓨터 사용 도구
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Messages/도구

컴퓨터 사용 도구

Claude는 컴퓨터 사용 도구를 통해 컴퓨터 환경과 상호작용할 수 있으며, 이 도구는 자율적인 데스크톱 상호작용을 위한 스크린샷 캡처 기능과 마우스/키보드 제어를 제공합니다. 실제 웹사이트에서의 자율적인 웹 탐색을 위한 벤치마크인 WebArena에서 Claude는 단일 에이전트 시스템 중 최고 수준의 결과를 달성하여, 여러 단계의 브라우저 작업을 처음부터 끝까지 완료하는 강력한 능력을 입증했습니다.



컴퓨터 사용은 베타 기능이며 베타 헤더가 필요합니다:

  • Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5의 경우 "computer-use-2025-11-24"
  • Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.1(지원 중단됨), Claude Sonnet 4(Bedrock 및 Vertex AI를 제외하고 종료됨), Claude Opus 4(Vertex AI를 제외하고 종료됨)의 경우 "computer-use-2025-01-24"

이 기능에 대한 피드백을 공유하려면 피드백 양식을 통해 문의해 주세요.



이 기능은 Zero Data Retention (ZDR)의 적용 대상입니다. 조직에 ZDR 계약이 체결되어 있는 경우, 이 기능을 통해 전송된 데이터는 API 응답이 반환된 후 저장되지 않습니다.

개요

컴퓨터 사용은 Claude가 데스크톱 환경과 상호작용할 수 있게 하는 베타 기능입니다. 이 도구는 다음을 제공합니다:

  • 스크린샷 캡처: 현재 화면에 표시된 내용 확인
  • 마우스 제어: 클릭, 드래그, 커서 이동
  • 키보드 입력: 텍스트 입력 및 키보드 단축키 사용
  • 데스크톱 자동화: 모든 애플리케이션 또는 인터페이스와 상호작용

컴퓨터 사용은 더 포괄적인 자동화 워크플로를 위해 bash 및 텍스트 편집기와 같은 다른 도구로 보강할 수 있지만, 컴퓨터 사용은 구체적으로 데스크톱 환경을 보고 제어하는 컴퓨터 사용 도구의 기능을 의미합니다.

모델 지원에 대해서는 도구 참조를 참조하세요.

보안 고려 사항

컴퓨터 사용은 표준 API 기능과는 다른 고유한 위험을 가진 베타 기능입니다. 이러한 위험은 인터넷과 상호작용할 때 더욱 커집니다.



위험을 최소화하려면 다음과 같은 예방 조치를 고려하세요:

  1. 직접적인 시스템 공격이나 사고를 방지하기 위해 최소 권한을 가진 전용 가상 머신 또는 컨테이너를 사용하세요.
  2. 정보 도난을 방지하기 위해 계정 로그인 정보와 같은 민감한 데이터에 대한 모델의 접근을 피하세요.
  3. 악성 콘텐츠에 대한 노출을 줄이기 위해 인터넷 접근을 허용된 도메인 목록으로 제한하세요.
  4. 의미 있는 실제 결과를 초래할 수 있는 결정과 쿠키 수락, 금융 거래 완료, 서비스 약관 동의와 같이 명시적 동의가 필요한 작업에 대해서는 사람이 확인하도록 요청하세요.

일부 상황에서 Claude는 사용자의 지시와 충돌하더라도 콘텐츠에서 발견된 명령을 따릅니다. 예를 들어, 웹페이지나 이미지에 포함된 Claude 지시사항이 기존 지시사항을 무시하게 하거나 Claude가 실수를 하게 만들 수 있습니다. 프롬프트 인젝션과 관련된 위험을 피하기 위해 Claude를 민감한 데이터 및 작업으로부터 격리하는 예방 조치를 취하세요.

Anthropic은 이러한 프롬프트 인젝션에 저항하도록 모델을 학습시켰으며 추가적인 방어 계층을 추가했습니다. 컴퓨터 사용 도구를 사용하면 분류기가 프롬프트에서 자동으로 실행되어 잠재적인 프롬프트 인젝션 사례를 표시합니다. 이러한 분류기가 스크린샷에서 잠재적인 프롬프트 인젝션을 식별하면, 다음 작업을 진행하기 전에 사용자 확인을 요청하도록 모델을 자동으로 유도합니다. 이 추가 보호 기능이 모든 사용 사례에 이상적이지는 않으므로(예: 사람이 개입하지 않는 사용 사례), 이 기능을 해제하고 싶으시면 지원팀에 문의하세요.

분류기 방어 계층이 있더라도 이러한 예방 조치는 여전히 중요합니다.

자체 제품에서 컴퓨터 사용을 활성화하기 전에 최종 사용자에게 관련 위험을 알리고 동의를 얻으세요.


컴퓨터 사용 참조 구현


웹 인터페이스, Docker 컨테이너, 예제 도구 구현 및 에이전트 루프를 포함하는 컴퓨터 사용 참조 구현으로 시작하세요.

빠른 시작

컴퓨터 사용을 시작하는 방법은 다음과 같습니다:

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-opus-4-8",  # or another compatible model
    max_tokens=1024,
    tools=[
        {
            "type": "computer_20251124",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
            "display_number": 1,
        },
        {"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"},
        {"type": "bash_20250124", "name": "bash"},
    ],
    messages=[{"role": "user", "content": "Save a picture of a cat to my desktop."}],
    betas=["computer-use-2025-11-24"],
)
print(response)


베타 헤더는 컴퓨터 사용 도구에만 필요합니다.

앞의 예제는 세 가지 도구를 모두 함께 사용하는 것을 보여주며, 컴퓨터 사용 도구가 포함되어 있기 때문에 베타 헤더가 필요합니다.


컴퓨터 사용 작동 방식

  1. 1

    Claude에 컴퓨터 사용 도구와 사용자 프롬프트 제공

    • API 요청에 컴퓨터 사용 도구(및 선택적으로 다른 도구)를 추가하세요.
    • 데스크톱 상호작용이 필요한 사용자 프롬프트를 포함하세요. 예: "내 데스크톱에 고양이 사진을 저장해 줘."
  2. 2

    Claude가 컴퓨터 사용 도구 선택

    • Claude는 컴퓨터 사용 도구가 사용자의 질문에 도움이 될 수 있는지 평가합니다.
    • 그렇다면 Claude는 올바른 형식의 도구 사용 요청을 구성합니다.
    • API 응답에는 도구 사용 요청을 나타내는 tool_use의 stop_reason이 포함됩니다.
  3. 3

    도구 입력 추출, 컴퓨터에서 도구 평가, 결과 반환

    • 사용자 측에서 Claude의 요청으로부터 도구 이름과 입력을 추출하세요.
    • 컨테이너 또는 가상 머신에서 도구를 사용하세요.
    • tool_result 콘텐츠 블록을 포함하는 새로운 user 메시지로 대화를 계속하세요.
  4. 4

    Claude가 작업을 완료할 때까지 컴퓨터 사용 도구를 계속 호출

    • Claude는 도구 결과를 분석하여 추가 도구 사용이 필요한지 또는 작업이 완료되었는지 판단합니다.
    • Claude가 다른 도구가 필요하다고 판단하면 또 다른 tool_use stop_reason으로 응답하며, 이 경우 3단계로 돌아가야 합니다.
    • 그렇지 않으면 사용자에게 텍스트 응답을 작성합니다.

사용자 입력 없이 3단계와 4단계를 반복하는 것을 "에이전트 루프"라고 합니다(즉, Claude가 도구 사용 요청으로 응답하고 애플리케이션이 해당 요청을 평가한 결과로 Claude에 응답하는 것).

컴퓨팅 환경

컴퓨터 사용에는 Claude가 애플리케이션 및 웹과 안전하게 상호작용할 수 있는 샌드박스 컴퓨팅 환경이 필요합니다. 이 환경에는 다음이 포함됩니다:

  1. 가상 디스플레이: Claude가 스크린샷을 통해 보고 마우스/키보드 동작으로 제어할 데스크톱 인터페이스를 렌더링하는 가상 X11 디스플레이 서버(Xvfb 사용).

  2. 데스크톱 환경: Linux에서 실행되는 창 관리자(Mutter)와 패널(Tint2)이 있는 경량 UI로, Claude가 상호작용할 수 있는 일관된 그래픽 인터페이스를 제공합니다.

  3. 애플리케이션: Claude가 작업을 완료하는 데 사용할 수 있는 Firefox, LibreOffice, 텍스트 편집기, 파일 관리자와 같은 사전 설치된 Linux 애플리케이션.

  4. 도구 구현: Claude의 추상적인 도구 요청(예: "마우스 이동" 또는 "스크린샷 촬영")을 가상 환경의 실제 작업으로 변환하는 통합 코드.

  5. 에이전트 루프: Claude와 환경 간의 통신을 처리하는 프로그램으로, Claude의 동작을 환경으로 전송하고 결과(스크린샷, 명령 출력)를 Claude에 다시 반환합니다.

컴퓨터 사용을 사용할 때 Claude는 이 환경에 직접 연결하지 않습니다. 대신 애플리케이션이 다음을 수행합니다:

  1. Claude의 도구 사용 요청 수신
  2. 컴퓨팅 환경에서 동작으로 변환
  3. 결과 캡처(예: 스크린샷 및 명령 출력)
  4. 이러한 결과를 Claude에 반환

보안 및 격리를 위해 참조 구현은 환경을 보고 상호작용하기 위한 적절한 포트 매핑과 함께 이 모든 것을 Docker 컨테이너 내에서 실행합니다.


컴퓨터 사용 구현 방법

참조 구현으로 시작하기

컴퓨터 사용을 시작하는 데 필요한 모든 것을 포함하는 참조 구현이 제공됩니다:

  • Claude와 함께 컴퓨터 사용에 적합한 컨테이너화된 환경
  • 컴퓨터 사용 도구의 구현
  • Claude API와 상호작용하고 컴퓨터 사용 도구를 실행하는 에이전트 루프
  • 컨테이너, 에이전트 루프 및 도구와 상호작용하기 위한 웹 인터페이스

에이전트 루프 이해하기

컴퓨터 사용의 핵심은 "에이전트 루프"입니다. 이는 Claude가 도구 동작을 요청하고, 애플리케이션이 이를 실행하고, 결과를 Claude에 반환하는 주기입니다. 다음은 간단한 예제입니다:

루프는 Claude가 도구를 요청하지 않고 응답하거나(작업 완료) 최대 반복 제한에 도달할 때까지 계속됩니다. 이 안전장치는 예상치 못한 API 비용을 초래할 수 있는 잠재적인 무한 루프를 방지합니다.

이 문서의 나머지 부분을 읽기 전에 참조 구현을 사용해 보세요.

프롬프팅으로 모델 성능 최적화

최상의 품질 출력을 얻기 위한 몇 가지 팁은 다음과 같습니다:

  1. 간단하고 명확하게 정의된 작업을 지정하고 각 단계에 대한 명시적인 지침을 제공하세요.
  2. Claude는 때때로 결과를 명시적으로 확인하지 않고 동작의 결과를 가정합니다. 이를 방지하려면 Claude에 다음과 같이 프롬프트를 제공할 수 있습니다: After each step, take a screenshot and carefully evaluate if you have achieved the right outcome. Explicitly show your thinking: "I have evaluated step X..." If not correct, try again. Only when you confirm a step was executed correctly should you move on to the next one.
  3. 일부 UI 요소(예: 드롭다운 및 스크롤바)는 Claude가 마우스 움직임으로 조작하기 어려울 수 있습니다. 이러한 경우 모델에 키보드 단축키를 사용하도록 프롬프트를 제공해 보세요.
  4. 반복 가능한 작업이나 UI 상호작용의 경우, 성공적인 결과의 예제 스크린샷과 도구 호출을 프롬프트에 포함하세요.
  5. 모델이 로그인해야 하는 경우, <robot_credentials>와 같은 XML 태그 안에 사용자 이름과 비밀번호를 프롬프트에 제공하세요. 로그인이 필요한 애플리케이션 내에서 컴퓨터 사용을 사용하면 프롬프트 인젝션으로 인한 부정적인 결과의 위험이 증가합니다. 모델에 로그인 자격 증명을 제공하기 전에 탈옥 및 프롬프트 인젝션 완화를 검토하세요.
  6. 사용자 턴의 content 배열을 구성할 때 지시 텍스트를 스크린샷 이미지 앞에 배치하세요. 이미지가 처리되기 전에 대상 설명을 제공하면 클릭 정확도가 향상됩니다.
  7. enable_zoom: true를 설정하여 computer_20251124를 사용할 때, Claude는 사이드바의 파일 이름, 탭 제목, 상태 표시줄 텍스트, 줄 번호, 버튼 레이블과 같이 스크린샷의 기본 해상도에서 읽을 수 없는 작은 텍스트나 특정 UI 요소에 대해 질문받으면 해당 영역을 확대합니다. Claude가 예상대로 확대하지 않는 경우, 화면 전체가 아닌 특정 영역이나 요소에 대해 질문하세요.


명확한 문제 세트를 반복적으로 마주치거나 Claude가 완료해야 할 작업을 미리 알고 있는 경우, 시스템 프롬프트를 사용하여 Claude에 작업을 성공적으로 수행하는 방법에 대한 명시적인 팁이나 지침을 제공하세요.



여러 세션에 걸쳐 있는 에이전트의 경우, 구현 후뿐만 아니라 각 세션 시작 시 엔드투엔드 검증을 실행하세요. 브라우저 기반 검사는 코드 수준 검토만으로는 놓치는 이전 세션의 회귀를 포착합니다. 자세한 내용은 장기 실행 에이전트를 위한 효과적인 하네스를 참조하세요.

시스템 프롬프트

Claude API를 통해 Anthropic 스키마 도구 중 하나가 요청되면 컴퓨터 사용 전용 시스템 프롬프트가 생성됩니다. 이는 도구 사용 시스템 프롬프트와 유사하지만 다음으로 시작합니다:

You have access to a set of functions you can use to answer the user's question. This includes access to a sandboxed computing environment. You do NOT currently have the ability to inspect files or interact with external resources, except by invoking the below functions.

일반 도구 사용과 마찬가지로 사용자가 제공한 system_prompt 필드는 여전히 존중되며 결합된 시스템 프롬프트 구성에 사용됩니다.

사용 가능한 동작

컴퓨터 사용 도구는 다음 동작을 지원합니다:

기본 동작(모든 버전)

  • screenshot: 현재 디스플레이 캡처
  • left_click: 좌표 [x, y]에서 클릭
  • type: 텍스트 문자열 입력
  • key: 키 또는 키 조합 누르기(예: "ctrl+s")
  • mouse_move: 커서를 좌표로 이동

향상된 동작(computer_20250124) 컴퓨터 사용을 지원하는 모든 모델에서 사용 가능:

  • scroll: 양 제어와 함께 모든 방향으로 스크롤
  • left_click_drag: 좌표 간 클릭 및 드래그
  • right_click, middle_click: 추가 마우스 버튼
  • double_click, triple_click: 다중 클릭
  • left_mouse_down, left_mouse_up: 세밀한 클릭 제어
  • hold_key: 지정된 시간(초) 동안 키 누르고 있기
  • wait: 동작 간 일시 정지

향상된 동작(computer_20251124) Claude Opus 4.8, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 사용 가능:

  • computer_20250124의 모든 동작
  • zoom: 화면의 특정 영역을 전체 해상도로 보기. 도구 정의에서 enable_zoom: true가 필요합니다. 검사할 영역의 왼쪽 상단 및 오른쪽 하단 모서리를 정의하는 좌표 [x1, y1, x2, y2]가 있는 region 매개변수를 받습니다.

도구 매개변수

매개변수필수설명
type예도구 버전(computer_20251124 또는 computer_20250124)
name예"computer"여야 함
display_width_px예디스플레이 너비(픽셀)
display_height_px예디스플레이 높이(픽셀)
display_number아니요X11 환경의 디스플레이 번호
enable_zoom아니요확대 동작 활성화(computer_20251124만 해당). Claude가 특정 화면 영역을 확대할 수 있도록 하려면 true로 설정하세요. 기본값: false


중요: 애플리케이션이 컴퓨터 사용 도구를 명시적으로 실행해야 합니다. Claude는 이를 직접 실행할 수 없습니다. Claude의 요청에 따라 스크린샷 캡처, 마우스 움직임, 키보드 입력 및 기타 동작을 구현하는 것은 사용자의 책임입니다.

확장 사고와 결합하기

컴퓨터 사용을 확장 사고와 결합하는 방법은 확장 사고를 참조하세요.



컴퓨터 사용의 경우, 내부 벤치마킹은 다음과 같은 effort 설정을 제안합니다:

  • Claude Opus 4.7: 기본값으로 high를 사용하세요. 높은 처리량 또는 비용에 민감한 워크로드에는 low를 사용하세요.
  • Claude Sonnet 4.6 및 Claude Opus 4.6: 기본값으로 medium을 사용하세요(최상의 정확도 대비 비용 비율). UI 작업에서 정확도를 개선하지 않으면서 토큰 비용만 추가하는 max는 피하세요. 이러한 모델에서 low는 사고를 완전히 비활성화하는 것보다 더 적은 출력 토큰을 사용하므로(실수가 적으면 재시도가 적음), 비용에 민감한 루프에 적합한 옵션입니다.

다른 도구로 컴퓨터 사용 보강하기

컴퓨터 사용과 함께 다른 도구를 추가하려면 동일한 tools 배열에 포함하세요. 빠른 시작 섹션에서는 bash 도구 및 텍스트 편집기 도구와 함께 이 패턴을 보여줍니다. 동일한 방식으로 자체 사용자 정의 도구 정의를 추가할 수 있습니다.

사용자 정의 컴퓨터 사용 환경 구축

참조 구현은 컴퓨터 사용을 시작하는 데 도움을 주기 위한 것입니다. 여기에는 Claude가 컴퓨터를 사용하는 데 필요한 모든 구성 요소가 포함되어 있습니다. 그러나 필요에 맞게 자체 컴퓨터 사용 환경을 구축할 수 있습니다. 다음이 필요합니다:

  • Claude와 함께 컴퓨터 사용에 적합한 가상화 또는 컨테이너화된 환경
  • Anthropic 스키마 컴퓨터 사용 도구 중 하나 이상의 구현
  • Claude API와 상호작용하고 도구 구현을 사용하여 tool_use 결과를 실행하는 에이전트 루프
  • 사용자 입력으로 에이전트 루프를 시작할 수 있는 API 또는 UI

컴퓨터 사용 도구 구현

컴퓨터 사용 도구는 스키마가 없는 도구로 구현됩니다. 이 도구를 사용할 때는 다른 도구와 같이 입력 스키마를 제공할 필요가 없습니다. 스키마는 Claude의 모델에 내장되어 있으며 수정할 수 없습니다.

  1. 1

    컴퓨팅 환경 설정

    Claude가 상호작용할 가상 디스플레이를 생성하거나 기존 디스플레이에 연결하세요. 일반적으로 Xvfb(X Virtual Framebuffer) 또는 유사한 기술을 설정하는 것이 포함됩니다.

  2. 2

    동작 핸들러 구현

    Claude가 요청할 수 있는 각 동작 유형을 처리하는 함수를 생성하세요:

  3. 3

    Claude의 도구 호출 처리

    Claude의 응답에서 도구 호출을 추출하고 실행하세요:

  4. 4

    에이전트 루프 구현

    Claude가 작업을 완료할 때까지 계속되는 루프를 생성하세요:

오류 처리

컴퓨터 사용 도구를 구현할 때 다양한 오류가 발생할 수 있습니다. 처리 방법은 다음과 같습니다:

이미지 제한에 맞게 스크린샷 크기 조정

컴퓨터 도구로 전송되는 스크린샷은 이미 Claude의 이미지 크기 제한 내에 맞아야 합니다(이미지 크기 제한 참조). API는 크기가 초과된 이미지의 크기를 조정하지 않습니다. 제한을 초과하는 스크린샷은 HTTP 400 유효성 검사 오류와 함께 거부됩니다.



제한은 모델에 따라 다릅니다. Claude Opus 4.8 및 Claude Opus 4.7은 긴 변에서 최대 2576픽셀을 허용합니다. 이전 모델은 긴 변에서 최대 1568픽셀, 총 약 1.15메가픽셀을 허용합니다. 다음 예제는 이전 모델의 1568px / 1.15MP 제한을 사용합니다. 사용 중인 모델의 제한으로 대체하세요.

화면이 제한보다 큰 경우, 전송하기 전에 스크린샷 크기를 조정하고, display_width_px/display_height_px를 조정된 크기로 설정하고, Claude가 반환한 좌표를 원래 화면 공간으로 다시 스케일링하세요:



macOS Retina 디스플레이는 디바이스 픽셀 비율 2로 스크린샷을 캡처하므로 이미지가 논리적 화면 좌표의 두 배 해상도입니다. 전송하기 전에 스크린샷을 2배 축소하거나, 클릭을 실행하기 전에 Claude가 반환한 좌표를 절반으로 줄이세요.

클릭 문제 진단

클릭이 대상을 놓치는 경우, 원인은 일반적으로 다음 중 하나입니다:

증상가능한 원인시도해 볼 방법
클릭이 한 방향으로 일관되게 오프셋됨display_width_px/display_height_px가 실제로 전송된 이미지 크기와 일치하지 않음디스플레이 크기가 전송하는 스크린샷과 정확히 일치하는지 확인하세요
클릭이 올바른 영역에 도달하지만 대상을 놓침대상이 매우 작거나, 4K+ 소스를 축소하면서 세부 정보가 손실되었거나, 종횡비가 왜곡됨enable_zoom: true를 설정하세요. 더 낮은 DPI로 캡처하거나 관련 영역으로 자르세요. 크기 조정 시 종횡비를 유지하세요
Claude가 완전히 잘못된 요소를 클릭함모호한 지시 또는 근처에 시각적으로 유사한 요소가 있음위치 기반 프롬프트를 사용하세요("오른쪽 하단의 파란색 Submit 버튼"). 상호작용을 더 작은 단계로 나누세요
정확도가 지속적으로 낮음해상도가 너무 낮음기준으로 1280x720을 시도해 보세요


모델 선택이 클릭 정밀도에 영향을 미칩니다. Claude Sonnet 4.6은 Claude Opus 4.6보다 클릭에서 기계적으로 더 정밀하며 스크린샷에 많은 축소가 필요할 때 더 견고합니다. Claude Opus 4.7은 그 격차를 좁힙니다. 클릭 정밀도는 Sonnet 4.6과 대략 비슷하며, 더 높은 해상도 제한으로 인해 축소가 덜 필요합니다.

구현 모범 사례 따르기


컴퓨터 사용의 제한 사항 이해하기

컴퓨터 사용 기능은 베타 버전입니다. Claude의 기능은 최첨단 수준이지만, 개발자는 다음과 같은 제한 사항을 인지해야 합니다:

  1. Latency(지연 시간): 현재 인간-AI 상호작용에서의 컴퓨터 사용 latency는 일반적인 사람이 직접 수행하는 컴퓨터 작업에 비해 너무 느릴 수 있습니다. 신뢰할 수 있는 환경에서 속도가 중요하지 않은 사용 사례(예: 백그라운드 정보 수집, 자동화된 소프트웨어 테스트)에 집중하세요.
  2. 컴퓨터 비전 정확도 및 신뢰성: Claude는 작업을 생성하는 동안 특정 좌표를 출력할 때 실수를 하거나 환각을 일으킬 수 있습니다. 확장 사고는 모델의 추론을 이해하고 잠재적인 문제를 식별하는 데 도움이 될 수 있습니다.
  3. 도구 선택 정확도 및 신뢰성: Claude는 작업을 생성하는 동안 도구를 선택할 때 실수를 하거나 환각을 일으킬 수 있으며, 문제를 해결하기 위해 예상치 못한 작업을 수행할 수 있습니다. 또한 틈새 애플리케이션이나 여러 애플리케이션과 동시에 상호작용할 때 신뢰성이 낮아질 수 있습니다. 복잡한 작업을 요청할 때는 모델에 신중하게 프롬프트를 제공하세요.
  4. 스크롤 신뢰성: 스크롤 작업은 방향 제어(위, 아래, 왼쪽, 오른쪽)와 지정된 양을 지원합니다. 스크롤이 적용되지 않는 애플리케이션에서는 Page Down과 같은 키보드 대안이 도움이 될 수 있습니다.
  5. 스프레드시트 상호작용: 세밀한 마우스 제어 작업(left_mouse_down, left_mouse_up)과 수정자 키 조합을 사용하여 개별 셀을 선택하세요. 복잡한 스프레드시트 작업은 여전히 여러 번의 시도가 필요할 수 있습니다.
  6. 소셜 및 커뮤니케이션 플랫폼에서의 계정 생성 및 콘텐츠 생성: Claude는 웹사이트를 방문하지만, 소셜 미디어 웹사이트 및 플랫폼 전반에서 계정을 생성하거나 콘텐츠를 생성 및 공유하거나 기타 방식으로 사람을 사칭하는 Claude의 능력은 제한되어 있습니다. 이 기능은 향후 업데이트될 수 있습니다.
  7. 취약점: 탈옥(jailbreaking)이나 프롬프트 주입(prompt injection)과 같은 취약점은 베타 컴퓨터 사용 API를 포함한 최첨단 AI 시스템 전반에 걸쳐 지속될 수 있습니다. 일부 상황에서 Claude는 콘텐츠에서 발견된 명령을 따르며, 때로는 사용자의 지시와 충돌하는 경우에도 그렇게 할 수 있습니다. 예를 들어, 웹페이지에 있거나 이미지에 포함된 Claude에 대한 지시가 기존 지시를 무시하게 하거나 Claude가 실수를 하도록 만들 수 있습니다. 다음 사항을 고려하세요: a. 최소 권한을 가진 가상 머신이나 컨테이너와 같은 신뢰할 수 있는 환경으로 컴퓨터 사용을 제한하기 b. 엄격한 감독 없이 민감한 계정이나 데이터에 대한 컴퓨터 사용 접근 권한을 부여하지 않기 c. 애플리케이션에서 컴퓨터 사용 기능에 필요한 권한을 활성화하거나 요청하기 전에 최종 사용자에게 관련 위험을 알리고 동의를 얻기
  8. 부적절하거나 불법적인 작업: Anthropic의 서비스 약관에 따라, 법률이나 사용 제한 정책(Acceptable Use Policy)을 위반하기 위해 컴퓨터 사용을 활용해서는 안 됩니다.

항상 Claude의 컴퓨터 사용 작업과 로그를 신중하게 검토하고 확인하세요. 사람의 감독 없이 완벽한 정밀도가 필요하거나 민감한 사용자 정보가 관련된 작업에는 Claude를 사용하지 마세요.

데이터 보존

컴퓨터 사용은 클라이언트 측 도구입니다. 세션에 관련된 모든 스크린샷, 마우스 작업, 키보드 입력 및 파일은 Anthropic이 아닌 사용자의 환경에서 캡처되고 저장됩니다. Anthropic은 API 호출의 일부로 스크린샷 이미지와 작업 요청을 실시간으로 처리하지만, 응답이 반환된 후에는 이를 보존하지 않습니다.

애플리케이션이 컴퓨터 사용 데이터가 저장되는 위치와 방식을 제어하기 때문에, 컴퓨터 사용은 ZDR 적용 대상입니다. 모든 기능에 대한 ZDR 적용 여부는 API 및 데이터 보존을 참조하세요.

가격 책정

컴퓨터 사용은 표준 도구 사용 가격 책정을 따릅니다. 컴퓨터 사용 도구를 사용할 때:

시스템 프롬프트 오버헤드: 컴퓨터 사용 베타는 시스템 프롬프트에 466-499개의 토큰을 추가합니다

컴퓨터 사용 도구 토큰 사용량:

모델도구 정의당 입력 토큰
Claude 4.x 모델735 토큰

추가 토큰 소비:

  • 스크린샷 이미지 (Vision 가격 책정 참조)
  • Claude에 반환되는 도구 실행 결과


컴퓨터 사용과 함께 bash 또는 텍스트 편집기 도구도 사용하는 경우, 해당 도구들은 각각의 페이지에 문서화된 자체 토큰 비용이 있습니다.

다음 단계


텍스트 편집기 도구

다음 도구로 계속하기: Claude로 파일 보기, 생성 및 편집

참조 구현


완전한 Docker 기반 구현으로 시작하기


도구 문서

도구 사용 및 사용자 정의 도구 생성에 대해 자세히 알아보기

상세 모범 사례


해상도, 사고 노력 및 컨텍스트 관리에 대한 벤치마크 기반 권장 사항

Was this page helpful?

  • 개요
  • 보안 고려 사항
  • 빠른 시작
  • 컴퓨터 사용 작동 방식
  • 컴퓨팅 환경
  • 컴퓨터 사용 구현 방법
  • 참조 구현으로 시작하기
  • 에이전트 루프 이해하기
  • 프롬프팅으로 모델 성능 최적화
  • 시스템 프롬프트
  • 사용 가능한 동작
  • 도구 매개변수
  • 확장 사고와 결합하기
  • 다른 도구로 컴퓨터 사용 보강하기
  • 사용자 정의 컴퓨터 사용 환경 구축
  • 컴퓨터 사용의 제한 사항 이해하기
  • 데이터 보존
  • 가격 책정
  • 다음 단계