今年8月,小米AI大模型首次亮相了。与其它公司的千亿参数“大模型”不同,小米AI大模型并没有专注于增加参数量,而是将13亿参数的模型下载到用户的手机本地运行。 小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌在接受采访时透露了他们考虑的因素。他说,与其他公司不同,小米拥有大量设备,这些设备的计算能力已经大幅提升。其次,小米是重端侧的公司,如果要大量调用云端算力,成本比较高。此外,用户隐私、用户使用手机时的网络情况等也是他们的考量因素。 不过,过小的参数量也可能影响用户的使用体验,因此小米需要在模型规模与硬件门槛之间做好平衡。王斌表示,他们相信除了通用能力,不同维度的小模型可能更适合某一任务,未来可能会以混合体的形式出现,既有云端,也有端侧,既有大模型,也有小模型,通过共通的生态,把用户体验做到极致。 据了解,小米从2016年7月起就开始布局AI,今年4月成立了大模型团队,相关团队超过了3000人。目前,小爱同学已经开始了AI大模型能力的升级,但并没有大范围地开放。
评论