近日,英伟达与Hugging Face和ServiceNow合作,推出了名为StarCoder2的LLMs系列模型,旨在成为代码生成领域的全新标准。这一系列模型包括了一个由ServiceNow训练的30亿参数模型、一个由Hugging Face训练的70亿参数模型以及一个由英伟达训练的150亿参数模型。
这一新模型通过使用名为Stack v2的新代码数据集实现,比Stack v1大七倍。新的训练技术使得该模型能够更好地理解低资源编程语言如COBOL、数学和程序源代码讨论等。
StarCoder2经过619门编程语言培训后,可以执行诸如源代码生成、工作流生成和文本摘要等专业任务。开发人员可以利用它进行代码补全、高级代码总结和代码片段检索等操作,从而提高工作效率。
相较于初版StarCoder LLMs,新的30亿参数模型进一步精简和筛选了优质参数,并且其性能相当于150亿参数模型的初版StarCoder。此外,该系列产品的使用权采用BigCode Open RAIL-M许可证,允许免费访问和使用。
关于相关阅读,《英伟达CEO黄仁勋寄语:学习编程价值大幅降低,生成式AI让人人都是程序员》的文章或许也能给读者带来一定启发。
评论