据英伟达官网消息,该公司最新发布了DeepSeek R1 671b版本的预览版。这款产品作为英伟达NIM(Nvidia Inference Microservices)微服务的组件,在build.nvidia.com平台上展示。
这一新型微服务基于单个英伟达HGX H200系统,具有卓越的性能,能够每秒处理高达3872个token。开发人员可以测试和实验这个API,并预计在未来,该API将以可下载的NIM微服务形式成为英伟达AI Enterprise软件平台的一部分。
NIM是一种云原生微服务技术,旨在简化生成式AI模型在云端、数据中心以及GPU加速工作站上的部署流程。
值得一提的是,DeepSeek R1是幻方量化旗下AI公司DeepSeek发布的大规模模型。其在多项任务中展现出与OpenAI的o1模型相媲美的性能。
通过推出这种高性能且可扩展的API和微服务,英伟达正在积极布局人工智能领域并推动该技术的发展。我们期待未来更多创新和突破性的技术问世,为用户提供更好的体验。

评论
更多评论