NVIDIA近日发布了名为Nemotron-70B的AI模型,并迅速引起了业界的广泛关注。据测试,这款模型在多个基准测试中超越了超过140个开闭源模型,仅次于OpenAI的最新模型o1。
此举引发了业内对于新开源王者的关注和热议。一些专业人士表示,在Llama 3.1训出的小型模型已经能够击败GPT-4和Claude 3.5 Sonnet这样的强大对手,可谓是一次技术上的飞跃。
值得注意的是,Nemotron-70B基于Llama-3.1-70B开发,在没有专门提示和额外推理token的情况下,它仍然能够正确回答复杂的推理问题,例如“草莓有几个r”的经典难题。
目前,Llama-3.1-Nemotron-70B-Instruct已经可以在线体验。此外,英伟达还公开了Nemotron的训练数据集HelpSteer2,包含如下内容:
首先是21362个提示响应,这些提示旨在使模型更加符合人类偏好,并且更有帮助、更连贯。此外还有20324个用于训练的提示响应和1038个用于验证的提示响应。
这一系列举动引发了业内对于NVIDIA在AI领域发展速度的关注。有专业人士认为,Nvidia正在以一种令人惊叹的方式推进AI技术的发展,并期待着未来他们还能带来什么样的惊喜。
评论