中关村在线

热点资讯

微软新技术:语音到图像, AI技术再突破

根据最新公示的专利清单,微软公司获得了一项新专利。该专利描述了一种基于用户实时输入语音生成图片的技术。据报道,这个系统可以在会议或讲座中实时捕捉音频,并通过语言模型进行总结,然后生成相应的AI图像。

这项工作被分为三个步骤:捕捉音频、处理文本和生成图像。用户可以通过麦克风发言,系统会实时记录并转化为文本。接下来,每段内容将通过语言模型进行总结。最后,根据总结生成的提示,系统将创建AI图像,并在屏幕上实时显示。

微软公司表示,这种图像的使用有助于澄清概念,并特别适合需要通过视觉辅助学习的用户。该功能预计主要应用于Microsoft Teams。随着演讲者话题的变化,实时生成的图像也会随之更新,从而增强视觉沟通的效果。

这项技术可能会对教育、医疗和其他行业产生影响。它提供了一种更直观和生动的方式来传达信息,并帮助人们更好地理解复杂的内容。尽管该技术还需要进一步完善和发展,但它无疑具有巨大的潜力。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具