版本更新与维护
更新引擎
更新 llama.cpp runtime 的标准思路是:
- 更新主仓库代码或获取新的发布包
- 更新对应平台 runtime
- 重启 Gateway 或客户端
源码仓库中,Windows CPU backend 的构建入口通常是:
powershell -NoProfile -ExecutionPolicy Bypass -File .\scripts\platforms\windows\build-llama-cpu.ps1
macOS 则使用对应的 scripts/platforms/macos/... 构建脚本。
runtime 目录
当前应优先围绕这些目录维护:
- 源码仓库:
.local/runtime/<platform>/<backend>/ - 发布包:
runtime/<backend>/
健康检查
curl http://127.0.0.1:9000/health
curl http://127.0.0.1:9000/omni/state
curl http://127.0.0.1:9000/omni/backends
/health 的当前稳定返回重点包括:
statusomni.backendomni.modelomni.ctx_sizeomni.backend_ready
维护建议
- 记录 runtime 升级前后的模型兼容性变化
- 把版本回退路径写进团队运维文档
- 出现启动异常时优先同时检查 Gateway 日志和 runtime 日志



