effort 매개변수를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 사이의 균형을 조절할 수 있습니다. effort 매개변수는 베타 헤더 없이 지원되는 모든 모델에서 일반적으로 사용할 수 있습니다.
effort 매개변수는 Claude Opus 4.6과 Claude Opus 4.5에서 지원됩니다.
Claude Opus 4.6의 경우, effort는 사고 깊이를 제어하는 권장 방법으로 budget_tokens를 대체합니다. 최상의 경험을 위해 effort를 적응형 사고 (thinking: {type: "adaptive"})와 함께 사용하세요. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용이 권장되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max effort에서 Claude는 거의 항상 사고합니다. 더 낮은 effort 수준에서는 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
기본적으로 Claude는 높은 effort를 사용하여 우수한 결과를 위해 필요한 만큼의 토큰을 사용합니다. effort 수준을 max로 올려 절대적으로 가장 높은 성능을 얻거나, 낮춰서 토큰 사용을 더 보수적으로 하여 일부 성능 감소를 감수하면서 속도와 비용을 최적화할 수 있습니다.
effort를 "high"로 설정하면 effort 매개변수를 완전히 생략한 것과 정확히 동일한 동작을 합니다.
effort 매개변수는 응답의 모든 토큰에 영향을 미치며, 여기에는 다음이 포함됩니다:
이 접근 방식에는 두 가지 주요 장점이 있습니다:
| 수준 | 설명 | 일반적인 사용 사례 |
|---|---|---|
max | 토큰 사용에 제한 없이 절대적으로 최대 성능을 발휘합니다. Opus 4.6 전용 — 다른 모델에서 max를 사용하는 요청은 오류를 반환합니다. | 가장 깊은 추론과 가장 철저한 분석이 필요한 작업 |
high | 높은 성능. 매개변수를 설정하지 않은 것과 동일합니다. | 복잡한 추론, 어려운 코딩 문제, 에이전트 작업 |
medium | 적당한 토큰 절약과 균형 잡힌 접근 방식. | 속도, 비용, 성능의 균형이 필요한 에이전트 작업 |
low | 가장 효율적. 일부 성능 감소와 함께 상당한 토큰 절약. | 최고의 속도와 최저 비용이 필요한 간단한 작업, 예를 들어 하위 에이전트 |
Effort는 행동 신호이지 엄격한 토큰 예산이 아닙니다. 낮은 effort 수준에서도 Claude는 충분히 어려운 문제에 대해 여전히 사고합니다 — 다만 동일한 문제에 대해 높은 effort 수준에서보다 적게 사고할 뿐입니다.
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
output_config={
"effort": "medium"
}
)
print(response.content[0].text)max를 사용하는 요청은 오류를 반환합니다.도구를 사용할 때, effort 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 effort 수준은 다음과 같은 경향이 있습니다:
높은 effort 수준은 다음과 같을 수 있습니다:
effort 매개변수는 확장된 사고와 함께 작동합니다. 동작은 모델에 따라 다릅니다:
thinking: {type: "adaptive"})를 사용하며, effort가 사고 깊이를 제어하는 권장 방법입니다. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용이 권장되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max effort에서 Claude는 거의 항상 깊이 사고합니다. 더 낮은 수준에서는 간단한 문제에 대해 사고를 건너뛸 수 있습니다.thinking: {type: "enabled", budget_tokens: N})를 사용하며, effort가 사고 토큰 예산과 함께 작동합니다. 작업에 맞는 effort 수준을 설정한 다음, 작업 복잡도에 따라 사고 토큰 예산을 설정하세요.effort 매개변수는 확장된 사고의 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 때도 텍스트 응답과 도구 호출에 대한 전체 토큰 사용을 제어합니다.
Was this page helpful?