全部动态

获奖|MobiSys 获奖研究:本地小模型如何改变交互体验

在 MobiSys 的工作中,我们关注的是小模型在端侧环境下如何以更低门槛、更低资源消耗去支撑真实交互体验,而不是只追求离线 benchmark 指标。

研究结果显示,当模型与系统能力深度结合时,即使参数规模有限,也能在任务理解、个性化适配和连续交互方面产生显著价值。

这次获奖既是对研究本身的认可,也让我们更加坚定地继续走端侧技术与产品协同演进的路线。

Agentic Coding: SWE-Bench Pro

Mock benchmark chart

Z
58.4
GLM-5.1
57.7
GPT-5.4
57.3
Claude
56.6
Qwen3
56.2
MiniMax
54.2
Gemini
53.8
Kimi