微软近日推出了其生成式人工智能模型Phi家族的最新成员——Phi-4。据微软介绍,Phi-4在多个领域相较于前一代模型均有所改进,尤其在解决数学问题方面表现突出,这主要得益于训练数据质量的提升。
目前,Phi-4的可用性相对有限,仅限于在微软新推出的Azure AI Foundry开发平台上使用,且仅限于研究目的,需遵循微软的研究许可协议。
Phi-4是微软最新推出的小型语言模型,拥有140亿个参数,其竞争对手包括GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku等其他小型模型。尽管规模较小,但Phi-4的性能却实现了显著提升,这主要归功于微软在训练数据方面的创新,包括使用高质量的合成数据集和人类生成内容数据集,以及一些未公开的后期训练改进。
近年来,小型语言模型的性能逐渐提高,越来越多的AI实验室开始关注合成数据和后期训练方面的创新。Scale AI首席执行官亚历山大·王在社交媒体上表示:“我们已经到了训练前数据墙的边缘。”这一观点也得到了多篇相关报道的印证。
值得注意的是,Phi-4是微软人工智能副总裁Sébastien Bubeck离职后推出的第一个Phi系列模型。Bubeck此前在微软负责Phi模型的开发工作,是该项目的关键人物之一,他于今年10月离开微软并加入OpenAI。尽管如此,Phi-4的推出仍然展示了微软在生成式AI领域的持续创新和投入。
评论