Loading...
    • 개발자 가이드
    • API 레퍼런스
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    시작하기
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.6의 새로운 기능마이그레이션 가이드모델 지원 중단가격
    Claude로 구축하기
    기능 개요Messages API 사용중지 사유 처리프롬프트 모범 사례
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집
    기능
    프롬프트 캐싱확장 사고적응형 사고노력 수준메시지 스트리밍배치 처리인용다국어 지원토큰 카운팅임베딩비전PDF 지원Files API검색 결과구조화된 출력
    도구
    개요도구 사용 구현 방법세분화된 도구 스트리밍Bash 도구코드 실행 도구프로그래밍 방식 도구 호출컴퓨터 사용 도구텍스트 편집기 도구웹 페치 도구웹 검색 도구메모리 도구도구 검색 도구
    Agent Skills
    개요빠른 시작모범 사례엔터프라이즈용 SkillsAPI로 Skills 사용
    Agent SDK
    개요빠른 시작TypeScript SDKTypeScript V2 (미리보기)Python SDK마이그레이션 가이드
    API에서 MCP
    MCP 커넥터원격 MCP 서버
    서드파티 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로 작성예시 사용 (멀티샷 프롬프팅)Claude에게 생각하게 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)복잡한 프롬프트 연결긴 컨텍스트 팁확장 사고 팁
    테스트 및 평가
    성공 기준 정의테스트 케이스 개발평가 도구 사용지연 시간 줄이기
    가드레일 강화
    환각 줄이기출력 일관성 높이기탈옥 방지스트리밍 거부프롬프트 유출 줄이기Claude 캐릭터 유지
    관리 및 모니터링
    Admin API 개요데이터 상주워크스페이스사용량 및 비용 APIClaude Code Analytics API제로 데이터 보존
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    서드파티 플랫폼의 Claude

    Vertex AI의 Claude

    Anthropic의 Claude 모델은 이제 Vertex AI를 통해 정식으로 사용할 수 있습니다.

    Was this page helpful?

    • Vertex AI 접근을 위한 SDK 설치
    • Vertex AI 접근
    • 글로벌 vs 리전 엔드포인트

    Claude에 접근하기 위한 Vertex API는 Messages API와 거의 동일하며 동일한 모든 옵션을 지원하지만, 두 가지 주요 차이점이 있습니다:

    • Vertex에서는 model이 요청 본문에 전달되지 않습니다. 대신 Google Cloud 엔드포인트 URL에 지정됩니다.
    • Vertex에서는 anthropic_version이 (헤더가 아닌) 요청 본문에 전달되며, vertex-2023-10-16 값으로 설정해야 합니다.

    Vertex는 Anthropic의 공식 클라이언트 SDK에서도 지원됩니다. 이 가이드에서는 Python 또는 TypeScript에서 Vertex AI의 Claude에 요청을 보내는 과정을 안내합니다.

    이 가이드는 이미 Vertex AI를 사용할 수 있는 GCP 프로젝트가 있다고 가정합니다. 필요한 설정 및 전체 안내에 대한 자세한 내용은 Anthropic의 Claude 3 모델 사용하기를 참조하세요.

    Vertex AI 접근을 위한 SDK 설치

    먼저, 원하는 언어에 맞는 Anthropic의 클라이언트 SDK를 설치합니다.

    pip install -U google-cloud-aiplatform "anthropic[vertex]"

    Vertex AI 접근

    모델 가용성

    Anthropic 모델 가용성은 지역에 따라 다릅니다. Vertex AI Model Garden에서 "Claude"를 검색하거나 Use Claude 3에서 최신 정보를 확인하세요.

    API 모델 ID

    모델Vertex AI API 모델 ID
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    요청 보내기

    요청을 실행하기 전에 GCP 인증을 위해 gcloud auth application-default login을 실행해야 할 수 있습니다.

    다음 예제는 Vertex AI에서 Claude로 텍스트를 생성하는 방법을 보여줍니다:

    자세한 내용은 클라이언트 SDK 및 공식 Vertex AI 문서를 참조하세요.

    활동 로깅

    Vertex는 사용과 관련된 프롬프트 및 완성을 로깅할 수 있는 요청-응답 로깅 서비스를 제공합니다.

    Anthropic은 활동을 이해하고 잠재적인 오용을 조사하기 위해 최소 30일 롤링 기준으로 활동을 로깅할 것을 권장합니다.

    이 서비스를 활성화해도 Google이나 Anthropic이 귀하의 콘텐츠에 접근할 수 있는 것은 아닙니다.

    기능 지원

    현재 Vertex에서 지원되는 모든 기능은 여기에서 확인할 수 있습니다.

    글로벌 vs 리전 엔드포인트

    Claude Sonnet 4.5 및 이후 모든 모델부터 Google Vertex AI는 두 가지 엔드포인트 유형을 제공합니다:

    • 글로벌 엔드포인트: 최대 가용성을 위한 동적 라우팅
    • 리전 엔드포인트: 특정 지리적 지역을 통한 보장된 데이터 라우팅

    리전 엔드포인트는 글로벌 엔드포인트 대비 10%의 가격 프리미엄이 포함됩니다.

    이는 Claude Sonnet 4.5 및 이후 모델에만 적용됩니다. 이전 모델(Claude Sonnet 4, Opus 4 및 그 이전)은 기존 가격 구조를 유지합니다.

    각 옵션을 사용해야 하는 경우

    글로벌 엔드포인트 (권장):

    • 최대 가용성과 가동 시간 제공
    • 사용 가능한 용량이 있는 지역으로 요청을 동적으로 라우팅
    • 가격 프리미엄 없음
    • 데이터 상주 요건이 유연한 애플리케이션에 적합
    • 종량제 트래픽만 지원 (프로비저닝된 처리량은 리전 엔드포인트 필요)

    리전 엔드포인트:

    • 특정 지리적 지역을 통해 트래픽 라우팅
    • 데이터 상주 및 규정 준수 요구 사항에 필요
    • 종량제 및 프로비저닝된 처리량 모두 지원
    • 10% 가격 프리미엄은 전용 리전 용량에 대한 인프라 비용을 반영

    구현

    글로벌 엔드포인트 사용 (권장):

    클라이언트를 초기화할 때 region 매개변수를 "global"로 설정합니다:

    리전 엔드포인트 사용:

    "us-east1" 또는 "europe-west1"과 같은 특정 지역을 지정합니다:

    추가 리소스

    • Google Vertex AI 가격: cloud.google.com/vertex-ai/generative-ai/pricing
    • Claude 모델 문서: Vertex AI의 Claude
    • Google 블로그 게시물: Claude 모델을 위한 글로벌 엔드포인트
    • Anthropic 가격 세부 정보: 가격 문서
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)
    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)