感谢网友Extraverity和名人在路上飞的线索投递!
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)正式发布了他们的最新产品——DeepSeek-R1模型,并同步开源了该模型的权重。
据官方介绍,DeepSeek-R1在后训练阶段采用了强化学习技术,在仅有极少标注数据的情况下,极大地提升了模型推理能力。在数学、代码、自然语言推理等任务上,它的性能已经达到了与OpenAI o1正式版相当的水平。
同时,DeepSeek还宣布他们将蒸馏6个小模型给社区使用。其中32B和70B模型在多项能力上实现了对标OpenAI o1mini的效果。
对于价格方面,DeepSeek-R1的服务定价是每百万输入tokens 1元(缓存命中),4元(缓存未命中),而每百万输出tokens则需要16元。
另外值得注意的是,DeepSeek已经公开了所有与DeepSeek-R1相关的技术,并且协议授权也做出了相应的调整:
首先是在License方面统一使用MIT许可;
其次用户现在可以利用模型输出、通过模型蒸馏等方式训练其他模型。
这些变化都意味着更加开放和共享的技术发展趋势。
评论