Messageを作成する際に、"stream": true を設定すると、server-sent events(SSE)を使用してレスポンスを段階的にストリーミングできます。
Python および TypeScript SDKは、複数のストリーミング方法を提供しています。PHP SDKは createStream() を介してストリーミングを提供します。Python SDKは同期ストリームと非同期ストリームの両方をサポートしています。詳細については、各SDKのドキュメントを参照してください。
client = anthropic.Anthropic()
with client.messages.stream(
max_tokens=1024,
messages=[{"role": "user", "content": "Hello"}],
model="claude-opus-4-8",
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)テキストが到着するたびに処理する必要がない場合、SDKは内部でストリーミングを使用しながら、.create() が返すものと同一の完全な Message オブジェクトを返す方法を提供しています。これは、SDKがHTTPタイムアウトを回避するためにストリーミングを必要とする、大きな max_tokens 値を持つリクエストで特に便利です。
client = anthropic.Anthropic()
with client.messages.stream(
max_tokens=128000,
messages=[{"role": "user", "content": "Write a detailed analysis..."}],
model="claude-opus-4-8",
) as stream:
message = stream.get_final_message()
print(message.content[0].text).stream() 呼び出しはserver-sent eventsでHTTP接続を維持し、その後 .get_final_message()(Python)または .finalMessage()(TypeScript)がすべてのイベントを蓄積して完全な Message オブジェクトを返します。Goでは、ストリームループ内で message.Accumulate(event) を呼び出して同じ完全な Message を構築します。Javaでは、MessageAccumulator.create() を使用し、各イベントに対して accumulator.accumulate(event) を呼び出します。C#では、ストリームの .Aggregate() 拡張メソッドをawaitして完全な Message を取得するか、MessageContentAggregator を .CollectAsync() に渡してイベントを処理しながら集約します。Rubyでは、ストリームに対して .accumulated_message を呼び出します。PHP SDKでは、ストリームイベントを手動で反復処理してレスポンスを蓄積します。
各server-sent eventには、名前付きのイベントタイプと関連するJSONデータが含まれます。各イベントはSSEイベント名(例:event: message_stop)を使用し、そのデータに対応するイベント type を含みます。
各ストリームは以下のイベントフローを使用します。
message_start:空の content を持つ Message オブジェクトを含みます。content_block_start、1つ以上の content_block_delta イベント、および content_block_stop イベントを持ちます。各コンテンツブロックには、最終的なMessageの content 配列内のインデックスに対応する index があります。例外として、サーバーサイドフォールバックレスポンス中は、各モデル境界で fallback コンテンツブロックが、間にデルタを含まない content_block_start と content_block_stop のペアとして到着します。Message オブジェクトへのトップレベルの変更を示す、1つ以上の message_delta イベント。message_stop イベント。message_delta イベントの usage フィールドに表示されるトークン数は累積値です。
イベントストリームには、任意の数の ping イベントが含まれる場合もあります。
APIは、イベントストリーム内でエラーを送信することがあります。たとえば、高負荷時には overloaded_error を受信することがあります。これは、非ストリーミングコンテキストでは通常HTTP 529に相当します。
event: error
data: {"type": "error", "error": {"type": "overloaded_error", "message": "Overloaded"}}バージョニングポリシーに従い、新しいイベントタイプが追加される可能性があるため、コードは未知のイベントタイプを適切に処理する必要があります。
各 content_block_delta イベントには、指定された index の content ブロックを更新するタイプの delta が含まれます。
text コンテンツブロックのデルタは次のようになります。
event: content_block_delta
data: {"type": "content_block_delta","index": 0,"delta": {"type": "text_delta", "text": "ello frien"}}tool_use コンテンツブロックのデルタは、ブロックの input フィールドの更新に対応します。最大限の粒度をサポートするため、デルタは_部分的なJSON文字列_ですが、最終的な tool_use.input は常に_オブジェクト_です。
文字列デルタを蓄積し、content_block_stop イベントを受信したらJSONをパースできます。部分的なJSONパースを行うには、Pydantic のようなライブラリを使用するか、パース済みの増分値にアクセスするためのヘルパーを提供するSDKを使用します。
tool_use コンテンツブロックのデルタは次のようになります。
event: content_block_delta
data: {"type": "content_block_delta","index": 1,"delta": {"type": "input_json_delta","partial_json": "{\"location\": \"San Fra"}}}注:現在のモデルは、一度に input から1つの完全なキーと値のプロパティのみを出力することをサポートしています。そのため、ツールを使用する際、モデルが処理している間、ストリーミングイベント間に遅延が発生する場合があります。input のキーと値が蓄積されると、それらはチャンク化された部分的なJSONとして複数の content_block_delta イベントとして出力されます。これにより、この形式は将来のモデルでより細かい粒度を自動的にサポートできるようになります。
ストリーミングを有効にして拡張思考を使用する場合、thinking_delta イベントを介して思考コンテンツを受信します。これらのデルタは、thinking コンテンツブロックの thinking フィールドに対応します。
思考コンテンツの場合、content_block_stop イベントの直前に特別な signature_delta イベントが送信されます。この署名は、思考ブロックの整合性を検証するために使用されます。
思考設定で display: "omitted" が設定されている場合、thinking_delta イベントは送信されません。思考ブロックが開き、単一の signature_delta を受信し、閉じます。思考表示の制御を参照してください。
典型的な思考デルタは次のようになります。
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "I need to find the GCD of 1071 and 462 using the Euclidean algorithm.\n\n1071 = 2 × 462 + 147"}}署名デルタは次のようになります。
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}ストリーミングモードを使用する場合は、クライアントSDKを使用してください。ただし、直接API統合を構築している場合は、これらのイベントを自分で処理する必要があります。
ストリームレスポンスは以下で構成されます。
message_start イベントcontent_block_start イベントcontent_block_delta イベント(場合により)content_block_stop イベントmessage_delta イベントmessage_stop イベントレスポンス全体に ping イベントが散在している場合もあります。形式の詳細については、イベントタイプを参照してください。
client = anthropic.Anthropic()
with client.messages.stream(
model="claude-opus-4-8",
messages=[{"role": "user", "content": "Hello"}],
max_tokens=256,
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)event: message_start
data: {"type": "message_start", "message": {"id": "msg_1nZdL29xx5MUA1yADyHTEsnR8uuvGzszyY", "type": "message", "role": "assistant", "content": [], "model": "claude-opus-4-8", "stop_reason": null, "stop_sequence": null, "usage": {"input_tokens": 25, "output_tokens": 1}}}
event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "text", "text": ""}}
event: ping
data: {"type": "ping"}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "text_delta", "text": "Hello"}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "text_delta", "text": "!"}}
event: content_block_stop
data: {"type": "content_block_stop", "index": 0}
event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence":null}, "usage": {"output_tokens": 15}}
event: message_stop
data: {"type": "message_stop"}
ツール使用は、パラメータ値のきめ細かいストリーミングをサポートしています。ツールごとに eager_input_streaming で有効にします。
このリクエストは、Claudeにツールを使用して天気を報告するよう求めます。
client = anthropic.Anthropic()
tools = [
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA",
}
},
"required": ["location"],
},
}
]
with client.messages.stream(
model="claude-opus-4-8",
max_tokens=1024,
tools=tools,
tool_choice={"type": "any"},
messages=[
{"role": "user", "content": "What is the weather like in San Francisco?"}
],
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)event: message_start
data: {"type":"message_start","message":{"id":"msg_014p7gG3wDgGV9EUtLvnow3U","type":"message","role":"assistant","model":"claude-opus-4-8","stop_sequence":null,"usage":{"input_tokens":472,"output_tokens":2},"content":[],"stop_reason":null}}
event: content_block_start
data: {"type":"content_block_start","index":0,"content_block":{"type":"text","text":""}}
event: ping
data: {"type": "ping"}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"Okay"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":","}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" let"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"'s"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" check"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" the"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" weather"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" for"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" San"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" Francisco"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":","}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" CA"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":":"}}
event: content_block_stop
data: {"type":"content_block_stop","index":0}
event: content_block_start
data: {"type":"content_block_start","index":1,"content_block":{"type":"tool_use","id":"toolu_01T1x1fJ34qAmk2tNTrN7Up6","name":"get_weather","input":{}}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":""}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"{\"location\":"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" \"San"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" Francisc"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"o,"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" CA\"}"}}
event: content_block_stop
data: {"type":"content_block_stop","index":1}
event: message_delta
data: {"type":"message_delta","delta":{"stop_reason":"tool_use","stop_sequence":null},"usage":{"output_tokens":89}}
event: message_stop
data: {"type":"message_stop"}このリクエストは、ストリーミングで拡張思考を有効にします。display: "summarized" 設定は、完全な思考の連鎖ではなく、Claudeの推論の要約をストリーミングします。
client = anthropic.Anthropic()
with client.messages.stream(
model="claude-opus-4-8",
max_tokens=20000,
thinking={"type": "adaptive", "display": "summarized"},
messages=[
{
"role": "user",
"content": "What is the greatest common divisor of 1071 and 462?",
}
],
) as stream:
for event in stream:
if event.type == "content_block_delta":
if event.delta.type == "thinking_delta":
print(event.delta.thinking, end="", flush=True)
elif event.delta.type == "text_delta":
print(event.delta.text, end="", flush=True)event: message_start
data: {"type": "message_start", "message": {"id": "msg_01...", "type": "message", "role": "assistant", "content": [], "model": "claude-opus-4-8", "stop_reason": null, "stop_sequence": null}}
event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "thinking", "thinking": "", "signature": ""}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "I need to find the GCD of 1071 and 462 using the Euclidean algorithm.\n\n1071 = 2 × 462 + 147"}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n462 = 3 × 147 + 21"}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n147 = 7 × 21 + 0"}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\nThe remainder is 0, so GCD(1071, 462) = 21."}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}
event: content_block_stop
data: {"type": "content_block_stop", "index": 0}
event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "text", "text": ""}}
event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "text_delta", "text": "The greatest common divisor of 1071 and 462 is **21**."}}
event: content_block_stop
data: {"type": "content_block_stop", "index": 1}
event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence": null}}
event: message_stop
data: {"type": "message_stop"}このリクエストは、Claudeに現在の天気情報をウェブで検索するよう求めます。
client = anthropic.Anthropic()
with client.messages.stream(
model="claude-opus-4-8",
max_tokens=1024,
tools=[{"type": "web_search_20250305", "name": "web_search", "max_uses": 5}],
messages=[
{"role": "user", "content": "What is the weather like in New York City today?"}
],
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)event: message_start
data: {"type":"message_start","message":{"id":"msg_01G...","type":"message","role":"assistant","model":"claude-opus-4-8","content":[],"stop_reason":null,"stop_sequence":null,"usage":{"input_tokens":2679,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":3}}}
event: content_block_start
data: {"type":"content_block_start","index":0,"content_block":{"type":"text","text":""}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"I'll check"}}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":" the current weather in New York City for you"}}
event: ping
data: {"type": "ping"}
event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"."}}
event: content_block_stop
data: {"type":"content_block_stop","index":0}
event: content_block_start
data: {"type":"content_block_start","index":1,"content_block":{"type":"server_tool_use","id":"srvtoolu_014hJH82Qum7Td6UV8gDXThB","name":"web_search","input":{}}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":""}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"{\"query"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"\":"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" \"weather"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":" NY"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"C to"}}
event: content_block_delta
data: {"type":"content_block_delta","index":1,"delta":{"type":"input_json_delta","partial_json":"day\"}"}}
event: content_block_stop
data: {"type":"content_block_stop","index":1 }
event: content_block_start
data: {"type":"content_block_start","index":2,"content_block":{"type":"web_search_tool_result","tool_use_id":"srvtoolu_014hJH82Qum7Td6UV8gDXThB","content":[{"type":"web_search_result","title":"Weather in New York City in May 2025 (New York) - detailed Weather Forecast for a month","url":"https://world-weather.info/forecast/usa/new_york/may-2025/","encrypted_content":"Ev0DCioIAxgCIiQ3NmU4ZmI4OC1k...","page_age":null},...]}}
event: content_block_stop
data: {"type":"content_block_stop","index":2}
event: content_block_start
data: {"type":"content_block_start","index":3,"content_block":{"type":"text","text":""}}
event: content_block_delta
data: {"type":"content_block_delta","index":3,"delta":{"type":"text_delta","text":"Here's the current weather information for New York"}}
event: content_block_delta
data: {"type":"content_block_delta","index":3,"delta":{"type":"text_delta","text":" City:\n\n# Weather"}}
event: content_block_delta
data: {"type":"content_block_delta","index":3,"delta":{"type":"text_delta","text":" in New York City"}}
event: content_block_delta
data: {"type":"content_block_delta","index":3,"delta":{"type":"text_delta","text":"\n\n"}}
...
event: content_block_stop
data: {"type":"content_block_stop","index":17}
event: message_delta
data: {"type":"message_delta","delta":{"stop_reason":"end_turn","stop_sequence":null},"usage":{"input_tokens":10682,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":510,"server_tool_use":{"web_search_requests":1}}}
event: message_stop
data: {"type":"message_stop"}Claude 4.5以前のモデルでは、ネットワークの問題、タイムアウト、その他のエラーによって中断されたストリーミングリクエストを、ストリームが中断された箇所から再開することで復旧できます。このアプローチにより、レスポンス全体を再処理する必要がなくなります。
基本的なリカバリ戦略は以下のとおりです。
Claude 4.6以降のモデルでは、同じキャプチャと再開の戦略が適用されますが、ステップ2が変わります。部分的なレスポンスをアシスタントメッセージに配置する代わりに、モデルに中断した箇所から続行するよう指示するユーザーメッセージを追加します。
Your previous response was interrupted and ended with [previous_response]. Continue from where you left off.text、tool_use、thinking)が含まれる可能性があることに注意してください。ツール使用および拡張思考ブロックは部分的に復旧できません。最新のテキストブロックからストリーミングを再開できます。ストリームが完了したら、各 stop_reason 値を処理します。
サーバーサイドのバッファリングなしでツール入力JSONをストリーミングし、レイテンシを低減します。
thinking_delta および signature_delta イベントで拡張思考の出力をストリーミングします。
ストリーミング、蓄積、再接続を処理する公式SDKを使用します。
リアルタイムレスポンスが不要な場合、大量のリクエストを非同期で処理します。
Was this page helpful?