1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模——讯飞星火X1。该模型在中文数学能力方面居于国内领先地位,并率先在教育、医疗等实际需求领域获得应用。
与此同时,讯飞星火4. 0Turbo平台的底座能力迎来了全面的升级,图文识别、数学处理及长文本的处理能力得到了显著增强,并首发混域知识搜索技术,旨在有效解决行业与企业面临的难点问题。
全国产算力攻关,打破技术壁垒
科大讯飞一直秉持全国产化的发展路径。尽管在国产算力平台上训练深度推理模型存在挑战,但通过与华为的合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。
在发布会上,科大讯飞研究院的研究员展示了讯飞星火X1对高考、AIME竞赛及高中奥林匹克竞赛题目的解答。讯飞星火X1不仅给出了正确答案,还详细解析了解题的方法和步骤,展现出更贴近人类“慢思考”的解题过程。
在此过程中,讯飞星火X1展现了其深度推理模型的三大特点:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。
尤为值得一提的是,讯飞星火X1近期参与了多项考试,如小初高(含竞赛)、大学(包含竞赛)、AIME、MATH 500等,取得了优异的成绩。其在业界的多项标志性指标中都位居第一,实现了以更少算力带来的卓越成果。
真实场景落地,教育医疗赋能
科大讯飞始终坚信“大模型的发展最终要落实到应用”。目前,讯飞星火X1已在教育领域率先实现应用落地。在去年104日,科大讯飞与中国教育科学研究院合作,推出了基于“问题链”的高中数学智能教师助手,正在全国范围内的百个试点区域内推广,与千名优秀教师携手打造多个经典案例。反馈显示,星火X1在一题多解、知识关联及拓展学生思维等方面表现突出,获赞无数。随着技术的不断深入融合,讯飞的AI学习机也将提供更精准的学习推荐与诊断,优化解题思路与知识系统,后续还将不断进行升级。
在医疗领域,讯飞星火X1的模型策略通过初步验证,已实现专科辅助诊断和复杂病历的准确率达90%。发布会上,科大讯飞宣布,基于讯飞星火X1的医疗大模型升级版将于今年上半年正式推出,力求在深层次诊断推理和质量控制效果上保持行业领先。
核心能力提升,全面对标 GPT-4o
讯飞星火4.0 Turbo底座能力再度升级,成为更加懂得行业需求的大模型。
此次发布会上,讯飞星火4. 0Turbo的核心能力得到了全新提升,全面对标 OpenAI 最新版的 GPT-4o。升级的主要特点在于聚焦行业与企业的痛点问题,同时在数学能力、行业知识、图文识别及长文本能力上取得显著进步。
数学能力一直是讯飞星火的强项,基于讯飞星火X1的高质量合成数据,讯飞星火4. 0 Turbo的数学处理能力更强,更能有效支持数学教学、金融分析和科研演示等工作。
图文识别优化,数据获取无忧
图文识别能力直接影响企业的效率,讯飞星火4. 0Turbo在这方面的提升,使得通用文档的版面分析和识别准确率增加了40%,特别针对复杂表格和潦草手写文字的准确率提高了60%。这些能力显著提升了高价值数据的获取效率。
长文本框架创新,知识溯源精准
此次升级还针对文档要素的检测进行了强化,使得知识的准确切分和构建更加精细,减少模型幻觉的发生。同时推出极速版扫描文档解析技术,使得从扫描到解析的速度提升超过10倍,优化了长文本处理效果。
首发混域搜索,信息整合高效
为了帮助用户在报告编写、调查研究等方面节省时间,讯飞星火还推出了混域知识搜索技术,用户可通过一次性提问获得综合搜索结果,极大提升了信息获取的便利性。
根据第三方数据统计,在2024年,讯飞星火在大模型的中标数与金额方面均将取得“双第一”,尤其是在能源、金融、汽车、电信等领域,与客户共同打造了近百个智能体应用。
借助“技术与应用”的良性循环,讯飞星火4.0 Turbo全面提升了其行业能力,特别是在金融、油气、电力、钢铁、航空等行业,整体能力提升幅度均超过10%。可以说,它是“最懂得行业需求的大模型”。
评论