开发者文档

模型与量化选择

应该选什么模型?

场景 推荐模型规模 推荐量化
快速问答、轻量任务 1B - 3B Q4_K_M
日常对话、代码辅助 7B - 8B Q4_K_M / Q5_K_M
高质量文本生成 13B - 14B Q4_K_M
图文理解 VLM 系列 Q4_K_M

为什么有些量化版本不可用?

常见原因包括:

  • 模型作者没有发布该量化版本
  • 模型架构较新,量化工具尚未完全支持
  • 高精度文件过大,托管平台未提供下载

如果确实需要某个量化版本,可以考虑使用 llama.cpp 提供的量化工具自行转换。

为什么运行时会显示不兼容?

常见原因包括:

  • 系统架构不匹配,例如 ARM 设备使用了 x86_64 构建版本
  • 操作系统版本过低
  • Windows 下使用了不合适的编译工具链
  • 缺少必要运行时依赖

推荐优先使用项目提供的预编译包,或使用官方脚本重新构建与当前平台匹配的运行时。

OmniMind

万象智维

Omni Studio 公众号二维码

公众号

Omni Studio 小红书二维码

小红书

© 2025 万象智维科技有限公司. All rights reserved.

京ICP备2025136340号-1