2026年1月14日,全球人工智能领域的竞争日益激烈,中美两国虽处于领先地位,但多国正积极布局,力图在这一轮科技变革中占据一席之地。印度近期也展现出强劲发展势头,提出要在AI领域取得重要突破。近日,印度169PI公司推出名为Alpie的大模型,引发广泛关注。
该模型被部分观点视为印度在大模型领域的重要尝试,目前已在多个平台开源,并开放API接口,用户可通过指定页面进行在线体验。Alpie参数规模为320亿,主打4bit量化技术,在保持轻量化的同时,性能表现颇为亮眼。
在多项权威评测中,Alpie展现出不俗实力。GSM8K数学推理榜单上,其成绩超越DeepSeek V3,与GPT-4o、Qwen 2.5-30B处于同一水平,仅略逊于Cluade 3.5。在SWE软件工程能力测试中,Alpie表现尤为突出,领先包括Claude 3.5在内的多个主流模型。BBH综合能力榜单中,其得分亦超过GPT-4o、Qwen 2.5及Cluade 3.5,仅次于DeepSeek V3。
尽管性能数据优异,Alpie的技术来源引发讨论。据披露,该模型并非完全由印度团队从零训练,而是在中国开源的DeepSeek-R1-Distill-Qwen-32B基础上,通过知识蒸馏与深度量化技术二次开发而成。这种基于现有模型优化的路径,显著降低了研发成本与资源消耗。相比GPT-4o,其训练与部署成本仅为十分之一,显存占用减少75%,可在16至24GB显存的设备上流畅运行,具备较强的实用性和部署灵活性。

评论
更多评论