中关村在线

热点资讯

商汤发布最新大模型,已支持10万字以上超长文本解析

商汤科技今日发布公告,宣布将配售B类股份以筹集资金。根据报道,本次配售吸引了多家战略投资人及头部海外基金参与,并且现有股东也进行了增持。商汤计划将这笔资金用于大模型研究及产品开发等项目。

值得注意的是,商汤将于7月5日的世界人工智能大会期间发布其最新的人工智能模型——“日日新5.5大模型”。虽然官方并未透露更多关于这款模型的细节信息,但有报道称该模型将进行重大升级,在长文本处理能力上取得了突破性进展。据悉,升级后的商汤大模型可以支持100万字以上的超长文本,并且最多一次可以解析50多个文件问题。

除此之外,商汤还于4月23日发布了其主打的大模型“日日新5.0”,采用了MOE混合专家架构,在知识、数学、推理和代码能力方面都有着显著提升。该模型基于超过10TB令牌的训练数据,具备200K个推理上下文窗口(相当于36.5万个汉字),在最高峰时上下文窗口可达200K左右。商汤表示,该模型在自然语言处理、图片生成、自动化数据标注、自定义模型训练等多个方面都具备了强大的能力,可与GPT-4 Turbo全面对标。

值得一提的是,商汤还计划于今年5月向粤语区用户免费推出粤语版商量语言/多模态大模型Web版及App版。同时,“商量语言大模型粤语版”及“商量多模态大模型粤语版”也将面向企业用户开放API。

相关阅读:

《商汤科技发布日日新5.0大模型》

《商汤科技推出面向粤语区用户的商量语言/多模态大模型Web版及App版》

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具