模型与量化选择

应该选什么模型？

场景	推荐模型规模	推荐量化
快速问答、轻量任务	1B - 3B	`Q4_K_M`
日常对话、代码辅助	7B - 8B	`Q4_K_M` / `Q5_K_M`
高质量文本生成	13B - 14B	`Q4_K_M`
图文理解	VLM 系列	`Q4_K_M`

为什么有些量化版本不可用？

常见原因包括：

模型作者没有发布该量化版本
模型架构较新，量化工具尚未完全支持
高精度文件过大，托管平台未提供下载

如果确实需要某个量化版本，可以考虑使用 llama.cpp 提供的量化工具自行转换。

为什么运行时会显示不兼容？

常见原因包括：

系统架构不匹配，例如 ARM 设备使用了 x86_64 构建版本
操作系统版本过低
Windows 下使用了不合适的编译工具链
缺少必要运行时依赖

推荐优先使用项目提供的预编译包，或使用官方脚本重新构建与当前平台匹配的运行时。

万象智维

Omni Studio 公众号二维码

公众号

Omni Studio 小红书二维码

小红书

© 2025 万象智维科技有限公司. All rights reserved.

京ICP备2025136340号-1