中关村在线

企业站

突破想象,智领未来:理光双赛道登顶国际信息检索顶会TREC

近日,国际信息检索领域顶级评测会议TREC(Text REtrieval Conference)公布了2025年最新赛果。理光中国研究院自然语言处理研发团队,在两大前沿赛道——Million LLMs TrackTip-of-the-Tongue Track中表现卓越,均斩获赛道冠军,展现出在智能信息处理与检索技术方面的强大实力。

关于TREC

TREC是由美国国家标准技术研究院(NIST)与国防部于1992年联合发起的国际性评测会议,旨在通过建立大规模标准化测试集与开放评估平台,推动信息检索技术的研发与应用。其核心目标包括:促进基于大规模型数据的检索研究、搭建产学研交流桥梁、加速实验室技术向商业产品转化,以及发展更适应现代系统的评估方法。历经多年发展,TREC不仅使检索系统效能实现显著提升(首六年效能增长约一倍),其构建的大规模测试集已成为行业标准,多数现代搜索引擎的核心技术均源于TREC的前沿探索。目前,TREC资源已向全球开放,持续赋能学术界与产业界的自主技术评估与创新。

两大前沿赛道的“硬核”突破

赛道一:MillionLLMs Track —— 预测大模型“答题力”

随着大型语言模型(LLM)的普及,用户正从传统文档检索转为直接向模型提问以获取答案。不同模型各有所长:有的擅长深度解析,有的专注事实回复,有的覆盖广泛知识,有的深耕垂直领域。在未向模型实际发起查询的情况下,仅凭模型的历史回答样本,预测其对用户问题的回答质量,成为该赛道的核心命题。该任务的核心挑战,一是无标注数据:仅提供查询与模型回复,缺乏模型排名标签;二是数据规模巨大:涵盖1.5万个查询,每个查询涉及1131个模型的回复,总计约1700万对数据。理光基于自研大模型RLM,凭借创新的算法设计与高效实现,荣获该赛道第一名。

赛道二:Tip-of-the-TongueTrack —— 破解“话在嘴边”搜索难题

所谓“话在嘴边(Tip-of-the-Tongue)”现象,是指从记忆中部分想起,或“即将想起”,但却无法准确回忆起某事的现象。例如:明明记得某部电影的情节片段、某首歌的旋律或某本书的大意,却怎么也想不起它的名字。该任务要求系统根据用户零散、模糊、甚至带有错误的描述,从整个维基百科中精准定位唯一对应的实体。任务面临着三项核心挑战:首先,查询多为自然语言长文本,必须超越传统的关键词匹配,深入理解语义与上下文,并支持多步推理;其次,用户记忆的表达方式复杂且本身不可靠,往往掺杂着主观感受、模糊信息甚至错误内容;最后,任务要求从上百万百科条目中精准找出唯一正确答案,在庞大的搜索空间中实现精确匹配。理光设计并构建了一套融合大模型能力的多层次、高鲁棒性检索系统,在面向复杂、模糊的真实用户查询场景时,展现出准确的意图理解能力和高效率、高精度的信息检索能力,最终斩获冠军。

技术为实,价值为向

此次在TREC的双赛道夺冠,是理光在自然语言处理与信息检索领域技术实力的有力证明,也是理光在推动数字化转型道路上迈出的坚实一步。

技术的根本价值,在于解决真实世界的课题。无论是提升知识管理效率,还是助力智能制造与先进医疗的发展,理光始终致力于将前沿认知智能技术,转化为可落地、可协作、可延展的系统能力。

未来,我们期待与更多合作伙伴携手,共同拓展智能技术的应用边界,赋能全球数字生态的持续创新与蓬勃发展。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具