支持的模型

当前已支持18款主流模型一键安装,更多模型持续接入中...

OpenAI 的开源权重模型旨在实现强大的推理、代理任务和多用途开发场景,gpt-oss-20b —— 适用于低延迟和本地或特定应用场景(21B 参数,其中 3.6B 活跃参数)

Qwen2.5 0.5B 指令调优模型,延续了系列在知识储备、编程数学能力、指令遵循及多语言支持上的全面优化,可高效处理结构化数据与长文本任务。

它采用搭载 RoPE 等优化机制的轻量化 Transformer 架构,以约 0.49B 极小参数实现高效推理,同时支持 32768 tokens 完整上下文与 8192 tokens 文本生成,极致轻量且性能实用。

Qwen2.5 1.5B 指令调优模型,继承了系列在知识储备、编程数学能力、指令遵循、多语言支持等方面的全面升级,处理结构化数据与长文本的表现优异。

它采用搭载 RoPE 等优化机制的精简 Transformer 架构,以 1.54B 参数实现高效推理,同时支持 32768 tokens 完整上下文与 8192 tokens 文本生成,兼顾轻量化与实用性能。

Qwen2.5 3B 指令调优模型承袭了系列在知识量、编程数学能力、指令遵循与多语言支持上的全面升级,在结构化数据处理、长文本生成及角色扮演场景下表现出色。

该模型采用搭载 RoPE 等优化方案的先进 Transformer 架构,以 30.9 亿参数实现均衡性能,支持 32768 tokens 完整上下文与 8192 tokens 文本生成。

Qwen2.5-7B 指令调优版依托专属专家模型训练,在知识储备、数学与代码能力上实现大幅跃升,同时具备优秀的指令遵从、结构化数据处理与多语言交互能力。

它采用优化版 Transformer 架构,搭配 GQA 注意力机制,在 76.1 亿参数规模下,可支持最高 131072 tokens 超长上下文,兼顾强大性能与实用的长文本生成能力。

Qwen2.5-VL 是 Qwen 家族最新视觉 - 语言模型,结合开发者反馈优化而成。其核心增强的是:精准识别多元视觉元素,可作为视觉代理指导工具操作,支持 1 小时以上长视频理解及事件捕捉,能精准视觉定位并输出 JSON,还可结构化处理发票、表格等数据。

Qwen2.5-VL 7B 是轻量化高性能视觉语言模型,7B 参数兼顾部署效率与强悍多模态能力,本地与端侧落地更灵活。

它可全面解析物体、文本、图表与布局,能作为视觉代理自主推理并操控设备,支持 1 小时以上长视频理解与片段定位。

Qwen 系列最新轻量化大语言模型,以 0.6B 小参数实现思考 / 非思考双模式无缝切换,32768tokens 长上下文加持下,推理、Agent、多语言等核心能力均实现大幅升级。

该模型兼容主流开发框架与本地推理工具,部署门槛低、使用便捷,小参数量下兼具高性能与落地实用性,可适配本地、端侧等多场景需求。

Qwen3-4B 是 Qwen3 系列新一代轻量化大语言模型,4B 参数规模下承袭了系列独创的思考 / 非思考双模式无缝切换能力,推理、Agent 工具调用、多语言等核心能力均实现进阶,且支持长上下文处理。

Qwen3 系列大语言模型,8B 参数规模下承袭了系列独创的思考 / 非思考双模式无缝切换特性,推理、Agent 工具调用、多语言处理等核心能力更优,长上下文处理表现进阶。

Qwen3-VL 是 Qwen 系列新一代视觉语言模型,支持图像、视频与文本统一理解,在视觉识别、结构化 OCR、文档解析与长视频理解场景中具备更强的通用能力。

2B 参数版本更适合本地与端侧部署,在保持多模态理解能力的同时,兼顾部署效率与资源占用。

Qwen3-VL 是 Qwen 系列新一代视觉语言模型,支持图像、视频与文本统一理解,在视觉识别、结构化 OCR、文档解析与长视频理解场景中具备更强的通用能力。

4B 参数版本在细粒度识别、文档解析与多模态交互之间取得更好的平衡,适合兼顾效果与部署成本的业务场景。

Qwen3-VL 是 Qwen 系列新一代视觉语言模型,支持图像、视频与文本统一理解,在视觉识别、结构化 OCR、文档解析与长视频理解场景中具备更强的通用能力。

8B 参数版本拥有更强的多模态推理、复杂视觉理解与长视频事件定位能力,适合对效果要求更高的生产环境。

Qwen3.5 系列的超轻量化大语言模型,0.8B 极小参数规模承袭了系列独创的思考 / 非思考双模式无缝切换能力,推理、Agent 工具调用、多语言处理等核心能力表现亮眼。

该模型部署门槛极低,兼容主流开发框架与本地推理工具,极致轻量化的同时兼顾实用性能,可灵活适配端侧、本地等低算力场景的落地需求。

Qwen3.5-2B 是 Qwen3.5 系列高性价比轻量化大模型,拥有同参数级别顶尖的 OCR 能力,无需图像预处理即可精准识别多角度、多质量文本并实现结构化输出,支持 256K 超长上下文,模型下载量高且实用表现亮眼。

Qwen3.5-4B 是 Qwen3.5 系列轻量化大语言模型,4B 参数规模承袭了系列思考 / 非思考双模式切换能力,推理、Agent 工具调用、多语言处理等核心能力在轻量化模型中表现出众。

Qwen3.5-9B 是 Qwen3.5 系列旗舰级轻量化多模态大模型,9B 参数凭借创新混合架构实现越级性能,推理与视觉理解能力超越 120B 级竞品,还支持 256K 超长上下文和 201 种语言,显存占用极低。

DeepSeek-R1-Distill-Qwen-1.5B 基于 Qwen-1.5B 经推理链蒸馏打造,1.5B 小参数规模实现近 7B 级别推理能力,在数学、代码任务中表现亮眼,MATH 数据集得分超 80 分、HumanEval 代码通过率超 50 分。

DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen-7B 经推理链蒸馏打造的模型,7B 参数规模下在数学、代码、逻辑推理上表现远超同量级模型,性能可接近 30B 级模型。

该模型对硬件要求极低,6GB 显存即可流畅运行,兼容 Ollama 等主流框架支持一键部署,轻量化特性适配消费级设备、边缘端等多场景落地需求。

该模型由 Qwen3-8B Base 经 DeepSeek-R1-0528 思维链蒸馏训练而成,在 AIME 2024 取得开源模型 SOTA 成绩,超原版 Qwen3-8B 10.0%。

该模型架构与 Qwen3-8B 完全一致,可沿用同款运行方式且新增系统提示支持,使用更便捷,同时遵循 MIT 协议,支持商业使用与模型蒸馏,兼具高适配性和实用价值

GLM-4-9B-0414 是智谱 AI 推出的轻量化大语言模型,9B 参数规模专为高并发、轻量级部署打造,且针对翻译等高频任务做了专项优化,兼顾部署效率与实际使用需求。

该模型性能远超同级别主流模型,在中文理解、数学推理、代码生成等维度表现亮眼,原生支持 26 种语言,还通过 GQA、RoPE 等技术优化了推理效率与长文本处理能力。