中关村在线

热点资讯

国内AI公司深度求索发布最强大模型 DeepSeek-R1性能已超OpenAI o1

感谢网友Extraverity和名人在路上飞的线索投递!

1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布了他们的最新产品——DeepSeek-R1模型,并同步开源了该模型的权重。

据官方介绍,DeepSeek-R1在后训练阶段采用了强化学习技术,在仅有极少标注数据的情况下,极大地提升了模型推理能力。在数学、代码、自然语言推理等任务上,它的性能已经达到了与OpenAI o1正式版相当的水平。

同时,DeepSeek还宣布他们将蒸馏6个小模型给社区使用。其中32B和70B模型在多项能力上实现了对标OpenAI o1mini的效果。

对于价格方面,DeepSeek-R1的服务定价是每百万输入tokens 1元(缓存命中),4元(缓存未命中),而每百万输出tokens则需要16元。

另外值得注意的是,DeepSeek已经公开了所有与DeepSeek-R1相关的技术,并且协议授权也做出了相应的调整:

首先是在License方面统一使用MIT许可;

其次用户现在可以利用模型输出、通过模型蒸馏等方式训练其他模型。

这些变化都意味着更加开放和共享的技术发展趋势。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具