流式输出与 Thinking

流式输出

CLI 默认会把对话结果以流式方式打印到终端。

这适合：

如果你想关闭流式输出：

./omniinfer chat --no-stream --message "Hello"

OmniInfer 支持查看和设置默认 thinking 状态：

./omniinfer thinking show
./omniinfer thinking set on
./omniinfer thinking set off

./omniinfer chat --think on --message "Explain your reasoning briefly."
./omniinfer chat --think off --message "Just answer directly."

不同模型对 thinking 的模板支持并不完全一致。

因此：