Loading...
    • 빌드
    • 관리
    • 모델 및 가격
    • 클라이언트 SDK
    • API 참조
    Search...
    ⌘K
    시작하기
    Claude 소개빠른 시작
    Claude로 구축하기
    기능 개요Messages API 사용중지 이유 처리
    모델 기능
    확장 사고적응형 사고노력빠른 모드 (베타: 리서치 프리뷰)구조화된 출력인용스트리밍 메시지일괄 처리검색 결과스트리밍 거부다국어 지원임베딩
    도구
    개요도구 사용 방법웹 검색 도구웹 가져오기 도구코드 실행 도구메모리 도구Bash 도구컴퓨터 사용 도구텍스트 편집기 도구
    도구 인프라
    도구 검색프로그래밍 방식 도구 호출세밀한 도구 스트리밍
    컨텍스트 관리
    컨텍스트 윈도우압축컨텍스트 편집프롬프트 캐싱토큰 계산
    파일 작업
    Files APIPDF 지원이미지 및 비전
    스킬
    개요빠른 시작모범 사례엔터프라이즈용 스킬API의 스킬
    MCP
    원격 MCP 서버MCP 커넥터
    프롬프트 엔지니어링
    개요프롬프트 모범 사례Console 프롬프트 도구
    테스트 및 평가
    성공 기준 정의 및 평가 구축Console의 평가 도구 사용지연 시간 줄이기
    가드레일 강화
    환각 줄이기출력 일관성 높이기탈옥 방지프롬프트 유출 줄이기
    리소스
    용어집
    릴리스 노트
    Claude Platform
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    모델 기능

    Effort

    effort 파라미터를 사용하여 Claude가 응답 시 사용하는 토큰 수를 제어하고, 응답의 철저함과 토큰 효율성 간의 균형을 조절하세요.

    Was this page helpful?

    • effort 작동 방식
    • Effort 수준
    • Sonnet 4.6에 권장되는 effort 수준
    • effort 파라미터를 조정해야 할 때
    • 도구 사용과 함께하는 Effort
    • 확장 사고와 함께하는 Effort

    This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

    effort 파라미터를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 간의 균형을 조절할 수 있습니다. effort 파라미터는 베타 헤더 없이 지원되는 모든 모델에서 일반적으로 사용 가능합니다.

    effort 파라미터는 Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 지원됩니다.

    Claude Opus 4.6 및 Sonnet 4.6의 경우, effort는 사고 깊이를 제어하는 권장 방법으로 budget_tokens를 대체합니다. 최상의 경험을 위해 effort와 적응형 사고 (thinking: {type: "adaptive"})를 함께 사용하세요. budget_tokens는 Opus 4.6 및 Sonnet 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max effort에서 Claude는 거의 항상 사고합니다. 낮은 effort 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.

    effort 작동 방식

    기본적으로 Claude는 높은 effort를 사용하여 우수한 결과를 위해 필요한 만큼 토큰을 사용합니다. effort 수준을 max로 높여 절대적으로 최고의 성능을 얻거나, 낮춰서 토큰 사용을 더 절약하고 일부 성능 저하를 감수하면서 속도와 비용을 최적화할 수 있습니다.

    effort를 "high"로 설정하면 effort 파라미터를 완전히 생략한 것과 동일한 동작이 생성됩니다.

    effort 파라미터는 응답의 모든 토큰에 영향을 미치며, 다음을 포함합니다:

    • 텍스트 응답 및 설명
    • 도구 호출 및 함수 인수
    • 확장 사고 (활성화된 경우)

    이 접근 방식에는 두 가지 주요 장점이 있습니다:

    1. 사용하기 위해 사고를 활성화할 필요가 없습니다.
    2. 도구 호출을 포함한 모든 토큰 지출에 영향을 줄 수 있습니다. 예를 들어, 낮은 effort는 Claude가 더 적은 도구 호출을 하게 됩니다. 이를 통해 효율성에 대한 훨씬 더 높은 수준의 제어가 가능합니다.

    Effort 수준

    수준설명일반적인 사용 사례
    max토큰 지출에 제약 없이 절대적인 최고 성능. Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능.가장 깊은 추론과 가장 철저한 분석이 필요한 작업
    high높은 성능. 파라미터를 설정하지 않은 것과 동일.복잡한 추론, 어려운 코딩 문제, 에이전트 작업
    medium적당한 토큰 절약으로 균형 잡힌 접근 방식.속도, 비용, 성능의 균형이 필요한 에이전트 작업
    low가장 효율적. 일부 성능 저하와 함께 상당한 토큰 절약.서브에이전트와 같이 최고의 속도와 최저 비용이 필요한 더 간단한 작업

    Effort는 엄격한 토큰 예산이 아닌 동작 신호입니다. 낮은 effort 수준에서도 Claude는 충분히 어려운 문제에 대해 여전히 사고하지만, 동일한 문제에 대해 더 높은 effort 수준보다 덜 사고합니다.

    Sonnet 4.6에 권장되는 effort 수준

    Sonnet 4.6은 기본적으로 high effort를 사용합니다. 예상치 못한 지연을 방지하려면 Sonnet 4.6 사용 시 effort를 명시적으로 설정하세요:

    • Medium effort (권장 기본값): 대부분의 애플리케이션에서 속도, 비용, 성능의 최적 균형. 에이전트 코딩, 도구 집약적 워크플로우, 코드 생성에 적합.
    • Low effort: 고용량 또는 지연에 민감한 워크로드에 적합. 더 빠른 처리가 우선시되는 채팅 및 비코딩 사용 사례에 적합.
    • High effort: Sonnet 4.6에서 최대 지능이 필요한 작업에 적합.
    • Max effort: 토큰 지출에 제약 없이 절대적으로 최고의 성능이 필요한 작업에 적합.

    기본 사용법

    effort 파라미터를 조정해야 할 때

    • 제약 없이 절대적으로 최고의 성능이 필요할 때 max effort를 사용하세요: 가장 철저한 추론과 가장 깊은 분석. Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능합니다.
    • Claude의 최선이 필요할 때 high effort(기본값)를 사용하세요: 복잡한 추론, 미묘한 분석, 어려운 코딩 문제, 또는 품질이 최우선인 모든 작업.
    • 전체 토큰 지출 없이 견고한 성능을 원할 때 균형 잡힌 옵션으로 medium effort를 사용하세요.
    • 속도(Claude가 더 적은 토큰으로 응답하기 때문에) 또는 비용을 최적화할 때 low effort를 사용하세요. 예를 들어, 간단한 분류 작업, 빠른 조회, 또는 한계적인 품질 향상이 추가적인 지연이나 비용을 정당화하지 않는 고용량 사용 사례.

    도구 사용과 함께하는 Effort

    도구를 사용할 때, effort 파라미터는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 effort 수준은 다음과 같은 경향이 있습니다:

    • 여러 작업을 더 적은 도구 호출로 결합
    • 더 적은 도구 호출 수행
    • 서문 없이 바로 행동으로 진행
    • 완료 후 간결한 확인 메시지 사용

    높은 effort 수준은 다음과 같을 수 있습니다:

    • 더 많은 도구 호출 수행
    • 행동하기 전에 계획 설명
    • 변경 사항에 대한 자세한 요약 제공
    • 더 포괄적인 코드 주석 포함

    확장 사고와 함께하는 Effort

    effort 파라미터는 확장 사고와 함께 작동합니다. 동작은 모델에 따라 다릅니다:

    • Claude Mythos Preview는 기본적으로 적응형 사고를 사용합니다(thinking 구성 불필요). thinking: {type: "disabled"}는 거부됩니다. Effort는 Opus 4.6과 동일한 방식으로 사고 깊이를 제어합니다.
    • Claude Opus 4.6은 적응형 사고 (thinking: {type: "adaptive"})를 사용하며, effort가 사고 깊이를 제어하는 권장 방법입니다. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max effort에서 Claude는 거의 항상 깊이 사고합니다. 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
    • Claude Sonnet 4.6은 적응형 사고(effort가 사고 깊이를 제어하는)를 사용합니다. 인터리브 모드를 사용한 수동 사고 (thinking: {type: "enabled", budget_tokens: N})는 여전히 작동하지만 더 이상 사용되지 않습니다.
    • Claude Opus 4.5 및 기타 Claude 4 모델은 수동 사고 (thinking: {type: "enabled", budget_tokens: N})를 사용하며, effort는 사고 토큰 예산과 함께 작동합니다. 작업에 맞는 effort 수준을 설정한 다음 작업 복잡성에 따라 사고 토큰 예산을 설정하세요.

    effort 파라미터는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 경우에도 텍스트 응답 및 도구 호출에 대한 전체 토큰 지출을 제어합니다.

    모범 사례

    1. effort를 명시적으로 설정하세요: API는 기본적으로 high이지만, 올바른 시작점은 모델과 워크로드에 따라 다릅니다.
    2. 속도에 민감하거나 간단한 작업에는 low를 사용하세요: 지연이 중요하거나 작업이 간단할 때, low effort는 응답 시간과 비용을 크게 줄일 수 있습니다.
    3. 사용 사례를 테스트하세요: effort 수준의 영향은 작업 유형에 따라 다릅니다. 배포하기 전에 특정 사용 사례에서 성능을 평가하세요.
    4. 동적 effort를 고려하세요: 작업 복잡성에 따라 effort를 조정하세요. 간단한 쿼리는 low effort가 적합할 수 있고, 에이전트 코딩과 복잡한 추론은 high effort의 혜택을 받습니다.
    curl https://api.anthropic.com/v1/messages \
        --header "x-api-key: $ANTHROPIC_API_KEY" \
        --header "anthropic-version: 2023-06-01" \
        --header "content-type: application/json" \
        --data '{
            "model": "claude-opus-4-6",
            "max_tokens": 4096,
            "messages": [{
                "role": "user",
                "content": "Analyze the trade-offs between microservices and monolithic architectures"
            }],
            "output_config": {
                "effort": "medium"
            }
        }'