2026年6月10日,最新一轮手机图形界面智能体综合能力测评结果公布。中兴自主研发的GUI智能体以91.29分的成绩位居榜首,大幅领先第二名,优势显著。
本次测评采用AgentCLUE-Mobile基准测试体系,聚焦于智能体在真实手机环境中自主操作应用程序的能力,包括完成外卖下单、车票预订、信息查询等典型任务。
中兴智能体搭载自研Nebula-Pilot V1.0 27B大模型,通过API调用方式部署运行。该技术路径在本次测评中整体表现突出,排名前三的方案均采用API调用架构,得分明显高于本地部署模式。其中,本地部署方案中表现最佳的是阿里巴巴的MAI-UI,得分为65.91分;字节跳动的UI-TARS得分为30.19分。
从参评机构来看,中兴通讯、智谱AI与阿里巴巴分列前三,阶跃星辰和字节跳动紧随其后。性能差异主要源于模型对界面结构的理解深度、控件识别准确度以及多步连续操作的稳定性。中兴方案在上述关键环节展现出更强的鲁棒性与一致性。
随着用户对手机自动化操作需求持续提升,智能体正逐步承担起高频、重复性任务的执行职责。此次测评结果表明,中兴在移动端智能交互技术研发方面已形成系统化优势,其模型能力与工程实现均已达到行业领先水平。未来,具备高效自主操作能力的智能体将加速融入日常使用场景,进一步提升移动设备的操作便捷性与用户体验。

评论
更多评论