开发者文档

版本更新与维护

更新引擎

更新 llama.cpp runtime 的标准思路是:

  1. 更新主仓库代码或获取新的发布包
  2. 更新对应平台 runtime
  3. 重启 Gateway 或客户端

源码仓库中,Windows CPU backend 的构建入口通常是:

powershell -NoProfile -ExecutionPolicy Bypass -File .\scripts\platforms\windows\build-llama-cpu.ps1

macOS 则使用对应的 scripts/platforms/macos/... 构建脚本。

runtime 目录

当前应优先围绕这些目录维护:

  • 源码仓库:.local/runtime/<platform>/<backend>/
  • 发布包:runtime/<backend>/

健康检查

curl http://127.0.0.1:9000/health
curl http://127.0.0.1:9000/omni/state
curl http://127.0.0.1:9000/omni/backends

/health 的当前稳定返回重点包括:

  • status
  • omni.backend
  • omni.model
  • omni.ctx_size
  • omni.backend_ready

维护建议

  • 记录 runtime 升级前后的模型兼容性变化
  • 把版本回退路径写进团队运维文档
  • 出现启动异常时优先同时检查 Gateway 日志和 runtime 日志
OmniMind

万象智维

Omni Studio 公众号二维码

公众号

Omni Studio 小红书二维码

小红书

© 2025 万象智维科技有限公司. All rights reserved.

京ICP备2025136340号-1