中关村在线

热点资讯

印度Alpie大模型惊艳登场:轻量化高效能,基于中国开源技术实现突破

2026年1月14日,全球人工智能领域的竞争日益激烈,中美两国虽处于领先地位,但多国正积极布局,力图在这一轮科技变革中占据一席之地。印度近期也展现出强劲发展势头,提出要在AI领域取得重要突破。近日,印度169PI公司推出名为Alpie的大模型,引发广泛关注。

该模型被部分观点视为印度在大模型领域的重要尝试,目前已在多个平台开源,并开放API接口,用户可通过指定页面进行在线体验。Alpie参数规模为320亿,主打4bit量化技术,在保持轻量化的同时,性能表现颇为亮眼。

在多项权威评测中,Alpie展现出不俗实力。GSM8K数学推理榜单上,其成绩超越DeepSeek V3,与GPT-4o、Qwen 2.5-30B处于同一水平,仅略逊于Cluade 3.5。在SWE软件工程能力测试中,Alpie表现尤为突出,领先包括Claude 3.5在内的多个主流模型。BBH综合能力榜单中,其得分亦超过GPT-4o、Qwen 2.5及Cluade 3.5,仅次于DeepSeek V3。

尽管性能数据优异,Alpie的技术来源引发讨论。据披露,该模型并非完全由印度团队从零训练,而是在中国开源的DeepSeek-R1-Distill-Qwen-32B基础上,通过知识蒸馏与深度量化技术二次开发而成。这种基于现有模型优化的路径,显著降低了研发成本与资源消耗。相比GPT-4o,其训练与部署成本仅为十分之一,显存占用减少75%,可在16至24GB显存的设备上流畅运行,具备较强的实用性和部署灵活性。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具