昆仑万维集团今日宣布,其自主研发的天工大模型4.0 o1版和4o版已同步上线,并免费提供给用户使用。天工大模型4.0 o1版被称之为国内首款具备中文逻辑推理能力的模型之一,除了上线即开源的模型外,还有两款性能更强的专用版本。该模型能够熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。
另外,昆仑万维还推出了天工大模型4.0 4o版,这是一款多模态模型,并配备了赋能的实时语音对话助手Skyo。Skyo是一个具备情感表达能力、快速响应能力和多语言流畅切换特点的智能语音对话工具。
据悉,在Skywork o1中采用了三阶段自研训练方案:首先是推理反思能力训练,通过自研的多智能体体系构造高质量的分步思考、反思和验证数据。其次是对基座模型进行继续预训练和监督微调,并在版本迭代中通过大规模使用自蒸馏和拒绝采样来显著提升模型的训练效率和逻辑推理能力。最后是推理能力强化学习,团队研发了最新的适配分步推理强化的Skywork o1 Process Reward Model(PRM),并结合自研分步推理强化算法进一步加强模型推理和思考能力。
值得注意的是,昆仑万维还推出了天工大模型4.0 o1版邀请测试版,该版本具备中文逻辑推理能力。
评论