支持的模型

当前已支持21款主流模型一键安装，更多模型持续接入中...

GPT-OSS

20B下载41.30 GB

OpenAI 的开源权重模型旨在实现强大的推理、代理任务和多用途开发场景，gpt-oss-20b —— 适用于低延迟和本地或特定应用场景。

Qwen2.5-0.5B-Instruct

0.5B下载999.60 MB

Qwen2.5 0.5B 指令调优模型，延续了系列在知识储备、编程数学能力、指令遵循及多语言支持上的全面优化，可高效处理结构化数据与长文本任务。

它采用搭载 RoPE 等优化机制的轻量化 Transformer 架构，同时支持 32768 tokens 完整上下文与 8192 tokens 文本生成，极致轻量且性能实用。

Qwen2.5-1.5B-Instruct

1.5B下载3.10GB

Qwen2.5 1.5B 指令调优模型，继承了系列在知识储备、编程数学能力、指令遵循、多语言支持等方面的全面升级，处理结构化数据与长文本的表现优异。

它采用搭载 RoPE 等优化机制的精简 Transformer 架构，以 1.54B 参数实现高效推理，支持 32768 tokens 完整上下文与 8192 tokens 文本生成。

Qwen2.5-3B-Instruct

3B下载6.18GB

Qwen2.5 3B 指令调优模型在知识量、编程数学能力、指令遵循与多语言支持上的全面升级，在结构化数据处理、长文本生成及角色扮演场景下表现出色。

该模型采用搭载 RoPE 等优化方案的先进 Transformer 架构，以 30.9 亿参数实现均衡性能，支持 32768 tokens 完整上下文与 8192 tokens 文本生成。

Qwen2.5-7B-Instruct

7B下载15.24GB

Qwen2.5-7B 指令调优版依托专属专家模型训练，在知识储备、数学与代码能力上实现大幅跃升，同时具备优秀的指令遵从、结构化数据处理与多语言交互能力。

它采用优化版 Transformer 架构，搭配 GQA 注意力机制，在 76.1 亿参数规模下，支持最高 131072 tokens 超长上下文，兼顾强大性能与实用的长文本生成能力。

Qwen2.5-VL-3B-Instruct

3B下载7.52GB

Qwen2.5-VL 是 Qwen 家族最新视觉语言模型，结合开发者反馈优化而成，可精准识别多元视觉元素，支持长视频理解、视觉定位与结构化输出。

Qwen2.5-VL-7B-Instruct

7B下载16.60GB

Qwen2.5-VL 7B 是轻量化高性能视觉语言模型，7B 参数兼顾部署效率与强悍多模态能力，本地与端侧落地更灵活。

它可全面解析物体、文本、图表与布局，能作为视觉代理自主推理并操控设备，支持 1 小时以上长视频理解与片段定位。

Qwen3-0.6B

0.6B下载1.52GB

轻量化大语言模型，以 0.6B 小参数实现思考 / 非思考双模式无缝切换，32768 tokens 长上下文加持下，推理、Agent、多语言等核心能力均实现大幅升级。

该模型兼容主流开发框架与本地推理工具，部署门槛低、使用便捷，小参数量下兼具高性能与落地实用性，可适配本地、端侧等多场景需求。

Qwen3-4B

4B下载8.06GB

Qwen3-4B 是 Qwen3 系列新一代轻量化大语言模型，4B 参数规模下承袭了系列独创的思考 / 非思考双模式无缝切换能力，推理、Agent 工具调用、多语言等核心能力均实现进阶，且支持长上下文处理。

Qwen3-8B

8B下载16.40GB

Qwen3 系列大语言模型，8B 参数规模下承袭了系列独创的思考 / 非思考双模式无缝切换特性，推理、Agent 工具调用、多语言处理等核心能力更优，长上下文处理表现进阶。

Qwen3-VL-2B-Instruct

2B下载4.27GB

Qwen3-VL 是 Qwen 系列新一代视觉语言模型，支持图像、视频与文本统一理解，在视觉识别、结构化 OCR、文档解析与长视频理解场景中具备更强的通用能力。

2B 参数版本更适合本地与端侧部署，在保持多模态理解能力的同时，兼顾部署效率与资源占用。

Qwen3-VL-4B-Instruct

4B下载8.89GB

4B 参数版本在细粒度识别、文档解析与多模态交互之间取得更好的平衡，适合兼顾效果与部署成本的业务场景。

Qwen3-VL-8B-Instruct

8B下载17.55GB

8B 参数版本拥有更强的多模态推理、复杂视觉理解与长视频事件定位能力，适合对效果要求更高的生产环境。

Qwen3.5-0.8B

0.8B下载1.77GB

超轻量化大语言模型，0.8B 极小参数规模承袭了系列独创的思考 / 非思考双模式无缝切换能力，推理、Agent 工具调用、多语言处理等核心能力表现亮眼。

该模型部署门槛极低，兼容主流开发框架与本地推理工具，极致轻量化的同时兼顾实用性能，可灵活适配端侧、本地等低算力场景的落地需求。

Qwen3.5-2B

2B下载4.57GB

Qwen3.5-2B 是 Qwen3.5 系列高性价比轻量化大模型，拥有同参数级别顶尖的 OCR 能力，无需图像预处理即可精准识别多角度、多质量文本并实现结构化输出，支持 256K 超长上下文，模型下载量高且实用表现亮眼。

Qwen3.5-4B

4B下载9.34GB

Qwen3.5-4B 是 Qwen3.5 系列轻量化大语言模型，4B 参数规模承袭了系列思考 / 非思考双模式切换能力，推理、Agent 工具调用、多语言处理等核心能力在轻量化模型中表现出众。

Qwen3.5-9B

9B下载19.33GB

Qwen3.5-9B 是 Qwen3.5 系列旗舰级轻量化多模态大模型，9B 参数凭借创新混合架构实现越级性能，推理与视觉理解能力超越 120B 级竞品，还支持 256K 超长上下文和 201 种语言，显存占用极低。

DeepSeek-R1-Distill-Qwen-1.5B

1.5B下载3.56GB

DeepSeek-R1-Distill-Qwen-1.5B 基于 Qwen-1.5B 经推理链蒸馏打造，1.5B 小参数规模实现近 7B 级别推理能力，在数学、代码任务中表现亮眼。

DeepSeek-R1-Distill-Qwen-7B

7B下载15.24GB

DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen-7B 经推理链蒸馏打造的模型，7B 参数规模下在数学、代码、逻辑推理上表现远超同量级模型，性能可接近 30B 级模型。

该模型对硬件要求极低，6GB 显存即可流畅运行，兼容 Ollama 等主流框架支持一键部署，轻量化特性适配消费级设备、边缘端等多场景落地需求。

DeepSeek-R1-0528-Qwen3-8B

8B下载16.39GB

该模型由 Qwen3-8B Base 经 DeepSeek-R1-0528 思维链蒸馏训练而成，在 AIME 2024 取得开源模型 SOTA 成绩，超原版 Qwen3-8B 10.0%。

该模型架构与 Qwen3-8B 完全一致，可沿用同款运行方式且新增系统提示支持，使用更便捷，同时遵循 MIT 协议，支持商业使用与模型蒸馏。

智谱GLM-4-9B-0414

9B下载18.82GB

GLM-4-9B-0414 是智谱 AI 推出的轻量化大语言模型，9B 参数规模专为高并发、轻量级部署打造，兼顾部署效率与实际使用需求。

该模型在中文理解、数学推理、代码生成等维度表现亮眼，原生支持多种语言，还通过 GQA、RoPE 等技术优化了推理效率与长文本处理能力。