Loading...
    0
    • 개발자 가이드
    • API 참고
    • MCP
    • 리소스
    • 릴리스 노트
    Search...
    ⌘K
    첫 단계
    Claude 소개빠른 시작
    모델 및 가격
    모델 개요모델 선택Claude 4.5의 새로운 기능Claude 4.5로 마이그레이션모델 지원 중단가격
    Claude로 빌드
    기능 개요Messages API 사용컨텍스트 윈도우프롬프트 작성 모범 사례
    기능
    프롬프트 캐싱컨텍스트 편집확장 사고노력메시지 스트리밍배치 처리인용다국어 지원토큰 계산임베딩비전PDF 지원Files API검색 결과구조화된 출력Google Sheets 애드온
    도구
    개요도구 사용 구현 방법토큰 효율적인 도구 사용세분화된 도구 스트리밍Bash 도구코드 실행 도구프로그래밍 방식 도구 호출컴퓨터 사용 도구텍스트 편집기 도구웹 페치 도구웹 검색 도구메모리 도구도구 검색 도구
    에이전트 스킬
    개요빠른 시작모범 사례API와 함께 스킬 사용
    에이전트 SDK
    개요TypeScript SDKPython SDK마이그레이션 가이드
    가이드
    스트리밍 입력권한 처리세션 관리SDK의 구조화된 출력에이전트 SDK 호스팅시스템 프롬프트 수정SDK의 MCP사용자 정의 도구SDK의 서브에이전트SDK의 슬래시 명령SDK의 에이전트 스킬비용 및 사용량 추적할 일 목록SDK의 플러그인
    API의 MCP
    MCP 커넥터원격 MCP 서버
    타사 플랫폼의 Claude
    Amazon BedrockMicrosoft FoundryVertex AI
    프롬프트 엔지니어링
    개요프롬프트 생성기프롬프트 템플릿 사용프롬프트 개선기명확하고 직접적으로예제 사용 (다중 샷 프롬프팅)Claude가 생각하도록 하기 (CoT)XML 태그 사용Claude에게 역할 부여 (시스템 프롬프트)Claude의 응답 미리 채우기복잡한 프롬프트 연결긴 컨텍스트 팁확장 사고 팁
    테스트 및 평가
    성공 기준 정의테스트 사례 개발평가 도구 사용지연 시간 감소
    보안 강화
    환각 감소출력 일관성 증가탈옥 완화거부 스트리밍프롬프트 유출 감소Claude를 캐릭터로 유지
    관리 및 모니터링
    Admin API 개요사용량 및 비용 APIClaude Code Analytics API
    Console
    기능

    노력

    노력 매개변수를 사용하여 Claude가 응답할 때 사용하는 토큰 수를 제어하고, 응답의 완전성과 토큰 효율성 간의 균형을 조절합니다.

    노력 매개변수를 사용하면 요청에 응답할 때 Claude가 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 완전성과 토큰 효율성 간의 균형을 조절할 수 있습니다.

    노력 매개변수는 현재 베타 버전이며 Claude Opus 4.5에서만 지원됩니다.

    이 기능을 사용할 때는 베타 헤더 effort-2025-11-24를 포함해야 합니다.

    노력 작동 방식

    기본적으로 Claude는 최대 노력을 사용하여 철저한 응답을 제공하기 위해 필요한 만큼 많은 토큰을 사용합니다. 노력 수준을 낮추면 Claude가 토큰을 더 보수적으로 사용하도록 지시하여 토큰을 더 비싼 리소스로 취급하게 할 수 있습니다.

    effort를 "high"로 설정하면 effort 매개변수를 생략한 것과 정확히 동일한 동작을 생성합니다.

    노력 매개변수는 다음을 포함한 응답의 모든 토큰에 영향을 미칩니다:

    • 텍스트 응답 및 설명
    • 도구 호출 및 함수 인수
    • 확장 사고(활성화된 경우)

    노력 수준

    수준설명일반적인 사용 사례
    high최대 완전성—Claude는 필요한 만큼 많은 토큰을 사용합니다. 매개변수를 설정하지 않은 것과 동등합니다.복잡한 분석, 상세한 설명, 교육 콘텐츠
    medium적당한 토큰 절감을 포함한 균형 잡힌 접근 방식입니다.대부분의 프로덕션 사용 사례, 비용 의식적인 애플리케이션
    low가장 토큰 효율적인 응답입니다.대량 자동화, 간단한 쿼리, 응답이 프로그래밍 방식으로 처리될 때

    기본 사용법

    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.beta.messages.create(
        model="claude-opus-4-5-20251101",
        betas=["effort-2025-11-24"],
        max_tokens=4096,
        messages=[{
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures"
        }],
        output_config={
            "effort": "medium"
        }
    )
    
    print(response.content[0].text)

    노력 수준별 동작

    노력 매개변수는 주로 응답 정확성이 아닌 출력 상세도와 설명 깊이를 제어합니다. Claude는 노력 수준에 관계없이 유사한 내부 추론을 수행하지만 해당 추론이 출력에 나타나는 정도를 조정합니다.

    낮은 노력 응답

    • 최소한의 설명으로 직접 답변 제시
    • 간결하고 효율적인 응답(1-2문장의 맥락)
    • 공식은 표시되지만 유도되지 않음
    • 독자가 답변을 확인할 수 있다고 가정
    • 도구 사용에 대한 간단한 확인("완료.", "수정됨.")

    중간 노력 응답

    • 답변 전 간단한 맥락
    • 주요 중간 단계를 포함한 간결한 정당화
    • 하나의 작업 예제 포함 가능
    • 여전히 효율성에 중점

    높은 노력 응답

    • 섹션 헤더로 구조화됨
    • 문제 설정 및 변수 정의
    • 단계별 해결 프로세스
    • 검증 및 타당성 확인
    • 풍부한 마크다운 형식

    사용 사례

    낮은 노력을 사용할 때

    • 속도 최적화: 낮은 토큰 수는 더 빠른 응답 시간을 의미하며, 지연 시간에 민감한 애플리케이션에 유리합니다
    • 자동화된 파이프라인: 응답이 인간이 읽는 것이 아닌 코드로 처리될 때
    • 대량 애플리케이션: 일상적인 간단한 쿼리에 대한 비용 절감
    • 숙련된 사용자: 사용자가 상세한 설명이 필요하지 않을 때
    • 빠른 확인: 간단한 예/아니오 또는 상태 응답

    중간 노력을 사용할 때

    • 프로덕션 API: 명확성과 비용 효율성의 균형
    • 사용자 대면 애플리케이션: 과도한 상세함 없이 충분한 맥락
    • 비용 의식적인 배포: 최소한의 품질 영향으로 상당한 절감

    높은 노력을 사용할 때(또는 노력 매개변수 없음)

    • 복잡한 분석: 완전성이 중요할 때
    • 교육 콘텐츠: 사용자가 추론을 이해해야 할 때
    • 문서: 응답이 참고 자료로 사용될 때
    • 디버깅: 상세한 설명이 문제 식별에 도움이 될 때

    도구 사용과 함께 노력

    도구를 사용할 때 노력 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 노력 수준은 다음 경향이 있습니다:

    • 여러 작업을 더 적은 도구 호출로 결합
    • 전문 없이 직접 작업으로 진행
    • 완료 후 간단한 확인 메시지 사용

    높은 노력 수준은 다음을 포함할 수 있습니다:

    • 작업 전 계획 설명
    • 변경 사항에 대한 상세한 요약
    • 더 포괄적인 코드 주석 포함

    확장 사고와 함께 노력

    노력 매개변수는 확장 사고가 활성화되었을 때 사고 토큰 예산과 함께 작동합니다. 이 두 제어는 다른 목적을 제공합니다:

    • 노력 매개변수: Claude가 모든 토큰(사고 토큰, 텍스트 응답, 도구 호출 포함)을 어떻게 사용하는지 제어합니다
    • 사고 토큰 예산: 특히 사고 토큰에 대한 최대 한계를 설정합니다

    노력 매개변수는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 둘 다 구성되었을 때:

    1. 먼저 작업에 적절한 노력 수준을 결정합니다
    2. 그런 다음 작업 복잡성에 따라 사고 토큰 예산을 설정합니다

    복잡한 추론 작업에서 최고의 성능을 위해 높은 노력(기본값)을 높은 사고 토큰 예산과 함께 사용합니다. 이를 통해 Claude가 철저하게 생각하고 포괄적인 응답을 제공할 수 있습니다.

    모범 사례

    1. 중간부터 시작: 대부분의 애플리케이션에서 중간 노력은 품질과 효율성의 좋은 균형을 제공합니다.

    2. 자동화에 낮은 노력 사용: 응답이 인간이 아닌 코드로 소비될 때 낮은 노력은 정확성에 영향을 주지 않으면서 비용을 크게 줄일 수 있습니다.

    3. 사용 사례 테스트: 노력 수준의 영향은 작업 유형에 따라 다릅니다. 배포하기 전에 특정 사용 사례에서 성능을 평가합니다.

    4. 품질 모니터링: 정확성은 일반적으로 노력 수준 전체에서 유지되지만 설명 품질은 다릅니다. 선택한 수준이 사용자의 요구를 충족하는지 확인합니다.

    5. 동적 노력 고려: 작업 복잡성이나 사용자 선호도에 따라 노력을 조정합니다. 간단한 쿼리는 낮은 노력을 보증할 수 있지만 복잡한 분석은 높은 노력의 이점을 얻습니다.

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy