노력 매개변수를 사용하면 요청에 응답할 때 Claude가 토큰을 사용하는 데 얼마나 적극적인지를 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 완전성과 토큰 효율성 사이의 균형을 조절할 수 있습니다.
노력 매개변수는 현재 베타 버전이며 Claude Opus 4.5에서만 지원됩니다.
이 기능을 사용할 때는 베타 헤더 effort-2025-11-24를 포함해야 합니다.
기본적으로 Claude는 최대 노력을 사용합니다. 즉, 최고의 결과를 위해 필요한 만큼 많은 토큰을 사용합니다. 노력 수준을 낮추면 Claude가 토큰 사용을 더 보수적으로 하도록 지시하여 속도와 비용을 최적화하면서 기능의 일부 감소를 수용할 수 있습니다.
effort를 "high"로 설정하면 effort 매개변수를 생략한 것과 정확히 동일한 동작을 합니다.
노력 매개변수는 다음을 포함한 모든 토큰에 영향을 미칩니다:
이 접근 방식에는 두 가지 주요 장점이 있습니다:
| 수준 | 설명 | 일반적인 사용 사례 |
|---|---|---|
high | 최대 기능. Claude는 최고의 결과를 위해 필요한 만큼 많은 토큰을 사용합니다. 매개변수를 설정하지 않은 것과 동일합니다. | 복잡한 추론, 어려운 코딩 문제, 에이전트 작업 |
medium | 적당한 토큰 절감을 포함한 균형 잡힌 접근 방식. | 속도, 비용 및 성능의 균형이 필요한 에이전트 작업 |
low | 가장 효율적입니다. 기능 감소를 수반하는 상당한 토큰 절감. | 최고의 속도와 최저 비용이 필요한 더 간단한 작업(예: 서브에이전트) |
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-opus-4-5-20251101",
betas=["effort-2025-11-24"],
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)도구를 사용할 때 노력 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 노력 수준은 다음과 같은 경향이 있습니다:
높은 노력 수준은 다음과 같을 수 있습니다:
노력 매개변수는 확장 사고가 활성화되었을 때 사고 토큰 예산과 함께 작동합니다. 이 두 가지 제어는 다른 목적을 제공합니다:
노력 매개변수는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 둘 다 구성된 경우:
복잡한 추론 작업에서 최고의 성능을 위해 높은 노력(기본값)을 높은 사고 토큰 예산과 함께 사용하세요. 이를 통해 Claude가 철저히 생각하고 포괄적인 응답을 제공할 수 있습니다.