8月1日,谷歌推出其Gemma 2系列新成员,即Gemma 2 2B模型。披露的资料显示,Gemma 2 2B利用了知识蒸馏技术,通过从更大、更复杂的模型中学习,将其知识传递到较小的模型中,取得了超出预期的性能表现。
图源:网络
根据谷歌公布的数据,在大模型竞技场LMSYS Chatbot Arena中,Gemma 2B得分高于GPT-3.5-Turbo。与Gemma 2B一同推出的包括安全内容分类器模型ShieldGemma和模型可解释性工具Gemma Scope。
据悉,Gemma 2 2B在“聊天机器人竞技场”排行榜上的表现尤为抢眼,以1130的高分,成功超越了包括GPT-3.5-Turbo-0613和Mixtral-8x7b在内的众多竞争对手,甚至能与一些体量十倍于它的模型抗衡。
图源:网络
得益于NVIDIA TensorRT-LLM库的优化,Gemma22B的部署十分高效,适用于从边缘设备到强大的云环境等多种场景。这使得它能够在数据中心、本地工作站和边缘AI应用中都能游刃有余。
在AI技术快速发展的背景下,谷歌的这一新发布无疑是在激烈竞争中的一次重要突破。对此,ML Commons的执行董事Rebecca Weiss表示,随着AI技术的成熟,整个行业都需要投入更多资源来开发高性能的安全评估工具,期待谷歌在这一领域的持续努力。
图源:网络
此外,Gemma 2 2B的发布正值Meta推出Llama3.1的时刻,该模型在大多数基准测试中也超越了OpenAI的GPT-4o。而OpenAI在上周也发布了更具性价比的GPT-4o mini,价格比GPT-40低了30倍,比GPT-3.5 Turbo便宜了60%。
评论