语言模型
01/22 2026
MANA: 通过多模式代理 UI 导航实现高效移动广告检测
MANA 将移动广告检测从简单的规则匹配提升到自主推理阶段,结合视觉、层级结构和交互轨迹,在复杂移动端界面中保持稳定的识别能力。
了解我们最新的研究成果
语言模型
01/22 2026
MANA 将移动广告检测从简单的规则匹配提升到自主推理阶段,结合视觉、层级结构和交互轨迹,在复杂移动端界面中保持稳定的识别能力。
语言模型
01/18 2026
我们提出一套适配端侧资源约束的规划执行框架,在保持低延迟响应的同时,提升多步骤任务中的状态追踪和工具调用成功率。
智能体系统
01/10 2026
围绕长期记忆存储成本高、检索时延不稳定的问题,我们设计了端侧记忆压缩与增量召回方案,显著提升持续对话体验。
多模态
12/30 2025
针对移动端复杂视觉环境,我们构建跨模态对齐机制,让模型在图像、文本与操作反馈之间更快建立任务语义关联。
推理优化
12/14 2025
该研究聚焦端云协同场景下的 token 级路由策略,通过动态切分推理负载,在吞吐、时延与稳定性之间取得更优平衡。
强化学习
12/01 2025
我们从 GUI 智能体的动作连续性出发,设计细粒度奖励机制,减少探索阶段的无效操作,提升策略学习效率与可迁移性。