Loading...
    • 개발자 가이드
    • API 레퍼런스
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    시작하기
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.6의 새로운 기능마이그레이션 가이드모델 지원 중단가격
    Claude로 구축하기
    기능 개요Messages API 사용중지 사유 처리프롬프트 모범 사례
    모델 기능
    확장 사고적응형 사고노력도빠른 모드 (연구 프리뷰)구조화된 출력인용스트리밍 메시지배치 처리PDF 지원검색 결과다국어 지원임베딩비전
    도구
    개요도구 사용 구현 방법웹 검색 도구웹 페치 도구코드 실행 도구메모리 도구Bash 도구컴퓨터 사용 도구텍스트 편집기 도구
    도구 인프라
    도구 검색프로그래밍 방식 도구 호출세분화된 도구 스트리밍
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집프롬프트 캐싱토큰 카운팅
    파일 및 자산
    Files API
    Agent Skills
    개요빠른 시작모범 사례엔터프라이즈용 SkillsAPI에서 Skills 사용
    Agent SDK
    개요빠른 시작TypeScript SDKTypeScript V2 (프리뷰)Python SDK마이그레이션 가이드
    API에서 MCP 사용
    MCP 커넥터원격 MCP 서버
    서드파티 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로 작성하기예시 사용 (멀티샷 프롬프팅)Claude에게 생각하게 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)복잡한 프롬프트 연결긴 컨텍스트 팁확장 사고 팁
    테스트 및 평가
    성공 기준 정의테스트 케이스 개발평가 도구 사용지연 시간 줄이기
    가드레일 강화
    환각 줄이기출력 일관성 높이기탈옥 방지스트리밍 거부프롬프트 유출 줄이기Claude 캐릭터 유지
    관리 및 모니터링
    Admin API 개요데이터 레지던시워크스페이스사용량 및 비용 APIClaude Code Analytics API제로 데이터 보존
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    모델 기능

    Effort

    effort 매개변수를 사용하여 Claude가 응답할 때 사용하는 토큰 수를 제어하고, 응답의 철저함과 토큰 효율성 사이의 균형을 조절하세요.

    effort 매개변수를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 사이의 균형을 조절할 수 있습니다. effort 매개변수는 베타 헤더 없이 지원되는 모든 모델에서 일반적으로 사용할 수 있습니다.

    effort 매개변수는 Claude Opus 4.6과 Claude Opus 4.5에서 지원됩니다.

    Claude Opus 4.6의 경우, effort는 사고 깊이를 제어하는 권장 방법으로 budget_tokens를 대체합니다. 최상의 경험을 위해 effort를 적응형 사고 (thinking: {type: "adaptive"})와 함께 사용하세요. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용이 권장되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max effort에서 Claude는 거의 항상 사고합니다. 더 낮은 effort 수준에서는 간단한 문제에 대해 사고를 건너뛸 수 있습니다.

    effort 작동 방식

    기본적으로 Claude는 높은 effort를 사용하여 우수한 결과를 위해 필요한 만큼의 토큰을 사용합니다. effort 수준을 max로 올려 절대적으로 가장 높은 성능을 얻거나, 낮춰서 토큰 사용을 더 보수적으로 하여 일부 성능 감소를 감수하면서 속도와 비용을 최적화할 수 있습니다.

    effort를 "high"로 설정하면 effort 매개변수를 완전히 생략한 것과 정확히 동일한 동작을 합니다.

    effort 매개변수는 응답의 모든 토큰에 영향을 미치며, 여기에는 다음이 포함됩니다:

    • 텍스트 응답 및 설명
    • 도구 호출 및 함수 인수
    • 확장된 사고 (활성화된 경우)

    이 접근 방식에는 두 가지 주요 장점이 있습니다:

    1. 사용하기 위해 사고를 활성화할 필요가 없습니다.
    2. 도구 호출을 포함한 모든 토큰 사용에 영향을 줄 수 있습니다. 예를 들어, 낮은 effort는 Claude가 더 적은 도구 호출을 수행한다는 것을 의미합니다. 이를 통해 효율성에 대한 훨씬 더 큰 수준의 제어가 가능합니다.

    Effort 수준

    수준설명일반적인 사용 사례
    max토큰 사용에 제한 없이 절대적으로 최대 성능을 발휘합니다. Opus 4.6 전용 — 다른 모델에서 max를 사용하는 요청은 오류를 반환합니다.가장 깊은 추론과 가장 철저한 분석이 필요한 작업
    high높은 성능. 매개변수를 설정하지 않은 것과 동일합니다.복잡한 추론, 어려운 코딩 문제, 에이전트 작업
    medium적당한 토큰 절약과 균형 잡힌 접근 방식.속도, 비용, 성능의 균형이 필요한 에이전트 작업
    low가장 효율적. 일부 성능 감소와 함께 상당한 토큰 절약.최고의 속도와 최저 비용이 필요한 간단한 작업, 예를 들어 하위 에이전트

    Effort는 행동 신호이지 엄격한 토큰 예산이 아닙니다. 낮은 effort 수준에서도 Claude는 충분히 어려운 문제에 대해 여전히 사고합니다 — 다만 동일한 문제에 대해 높은 effort 수준에서보다 적게 사고할 뿐입니다.

    기본 사용법

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    effort 매개변수를 언제 조정해야 하나요?

    • 제한 없이 절대적으로 가장 높은 성능이 필요할 때—가장 철저한 추론과 가장 깊은 분석이 필요할 때 max effort를 사용하세요. Opus 4.6에서만 사용 가능하며, 다른 모델에서 max를 사용하는 요청은 오류를 반환합니다.
    • Claude의 최고 수준의 작업이 필요할 때—복잡한 추론, 미묘한 분석, 어려운 코딩 문제, 또는 품질이 최우선인 모든 작업에 high effort(기본값)를 사용하세요.
    • high effort의 전체 토큰 지출 없이 견고한 성능을 원할 때 균형 잡힌 옵션으로 medium effort를 사용하세요.
    • 속도(Claude가 더 적은 토큰으로 응답하므로) 또는 비용을 최적화할 때 low effort를 사용하세요—예를 들어, 간단한 분류 작업, 빠른 조회, 또는 한계적인 품질 향상이 추가 지연 시간이나 비용을 정당화하지 못하는 대량 사용 사례에 적합합니다.

    도구 사용과 effort

    도구를 사용할 때, effort 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 effort 수준은 다음과 같은 경향이 있습니다:

    • 여러 작업을 더 적은 도구 호출로 결합
    • 더 적은 도구 호출 수행
    • 서문 없이 바로 작업 진행
    • 완료 후 간결한 확인 메시지 사용

    높은 effort 수준은 다음과 같을 수 있습니다:

    • 더 많은 도구 호출 수행
    • 작업 수행 전 계획 설명
    • 변경 사항에 대한 상세한 요약 제공
    • 더 포괄적인 코드 주석 포함

    확장된 사고와 effort

    effort 매개변수는 확장된 사고와 함께 작동합니다. 동작은 모델에 따라 다릅니다:

    • Claude Opus 4.6은 적응형 사고 (thinking: {type: "adaptive"})를 사용하며, effort가 사고 깊이를 제어하는 권장 방법입니다. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용이 권장되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max effort에서 Claude는 거의 항상 깊이 사고합니다. 더 낮은 수준에서는 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
    • Claude Opus 4.5는 수동 사고 (thinking: {type: "enabled", budget_tokens: N})를 사용하며, effort가 사고 토큰 예산과 함께 작동합니다. 작업에 맞는 effort 수준을 설정한 다음, 작업 복잡도에 따라 사고 토큰 예산을 설정하세요.

    effort 매개변수는 확장된 사고의 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 때도 텍스트 응답과 도구 호출에 대한 전체 토큰 사용을 제어합니다.

    모범 사례

    1. high로 시작하세요: 성능과 토큰 효율성 사이의 균형을 위해 더 낮은 effort 수준을 사용하세요.
    2. 속도에 민감하거나 간단한 작업에는 low를 사용하세요: 지연 시간이 중요하거나 작업이 간단할 때, low effort는 응답 시간과 비용을 크게 줄일 수 있습니다.
    3. 사용 사례를 테스트하세요: effort 수준의 영향은 작업 유형에 따라 다릅니다. 배포하기 전에 특정 사용 사례에서 성능을 평가하세요.
    4. 동적 effort를 고려하세요: 작업 복잡도에 따라 effort를 조정하세요. 간단한 쿼리는 low effort가 적합할 수 있고, 에이전트 코딩과 복잡한 추론은 high effort가 유리합니다.

    Was this page helpful?

    • effort 작동 방식
    • Effort 수준
    • effort 매개변수를 언제 조정해야 하나요?
    • 도구 사용과 effort
    • 확장된 사고와 effort