流式响应
如何开启
把 stream 设为 true:
{
"messages": [{"role": "user", "content": "Hello"}],
"stream": true
}
返回形式
流式响应使用 Server-Sent Events(SSE)。
每个事件以 data: 开头,最后以:
data: [DONE]
结束。
典型片段
data: {"choices":[{"delta":{"content":"Hel"}}]}
data: {"choices":[{"delta":{"content":"lo"}}]}
data: {"usage":{"prompt_tokens":13,"completion_tokens":12,"total_tokens":25}}
data: [DONE]
CLI 与 API 的关系
CLI 的默认流式输出,本质上也是消费同一条 chat completions 流式链路。



