中关村在线

热点资讯

豆包发布Seed-Audio 1.0,实现文生音频全模态AI创作闭环

2026年6月23日,在火山引擎FORCE原动力大会上,豆包系列五大模型同步发布,包括豆包大模型2.1 Pro、视频生成模型Seedance 2.5、Seedance 2.0 4K版本、图像创作模型Seedream 5.0 Pro,以及全新推出的音频生成模型Seed-Audio 1.0。

Seed-Audio 1.0标志着豆包在音频生成能力上的重要突破。该模型显著降低了高质量语音内容规模化生产的门槛,支持在单次生成过程中,同步完成角色对白编排、情绪与语气调控、方言与口音适配、背景音乐融合及拟音特效添加,直接输出达到影视级水准的完整音效成品。

在长音频内容创作场景中,如长篇有声书、播客节目及系列广播剧,模型通过文本到音频与参考音频的深度协同机制,确保全篇音色高度一致,大幅压缩后期修音所需的时间与人力投入。

此外,Seed-Audio 1.0具备零样本多模态声音推理能力。用户仅需提供一段文字描述,模型即可自主解析并生成与之语义匹配的声音特征,无需提供任何语音样本。

随着该音频模型的正式上线,豆包已全面覆盖文字、图像、视频及音频四大内容模态,形成端到端的AI创作闭环。结合本次同步发布的图文与视频生成工具,内容创作者得以在一个统一平台上完成全流程智能生产,真正实现高效、连贯、一体化的创作体验。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具