全球电子表格自动化领域权威评测基准SpreadsheetBench近日发布最新评估结果。在涵盖全部912个真实场景题目的全量榜单中,WPS AI表格智能体以73.46%的准确率位居首位,成为全球表现最佳的同类产品,领先于多家国际主流科技企业推出的同类解决方案。
本次评测题目全部源自实际Excel用户社区,覆盖非标准数据结构、跨表联动、多步骤复合操作等高难度任务,重点考察人工智能对用户意图的理解深度与复杂指令的执行精度。评测同期公布的人类专家平均准确率为71.33%。
WPS AI表格智能体依托自主研发的表格领域专用AI基座构建,此前已在经过专家精细标注的子榜单中取得领先成绩。此次在全量榜单中再次夺冠,并首次实现对人类专家基准线的超越,表明其已实现从底层模型能力到实际产品落地的完整闭环验证。

评论
更多评论