AIGC语音合成技术方案你了解吗?

AIGC语音合成技术方案你了解吗?

发布时间:2023-03-13 作者:创始人

  3月5日,正值“向雷锋同志学习”题词60周年,长江日报联合百度智能云打造的“和雷锋一起读《雷锋日记》”上线,采用百度新一代面向AIGC的语音合成技术方案,基于雷锋原始录音,即可完成声音建模,生动地合成模拟雷锋阅读《雷锋日记》的声音,收获了无数用户的点赞!

  本次雷锋声音的还原,采用了百度新一代面向AIGC的语音合成技术方案,在核心技术方案上包括三大创新:

1、 大幅降低了录音质量的门槛,无需到录音棚录制,也无需照稿朗读,仅需提供已有录音,1天内即可完成快速建库:依托了百度语音合成研发的语音->文本->语音的自重构预训练框架完成自动建模,可精确提取出对应到字的细粒度声学特征,保留了原始语音中绝大部分的表达方式,使得几句到几万句训练的模型都能够稳定合成;

2、 只需要提供50~150句的语音,即可完成声音建模,获得媲美上千句的企业级音库的效果:创新研发了相应的富表现力合成技术,通过引入概率分布完成一对多的细粒度声学特征建模,为合成提供更多的多样性选择,克服了少量录音数据带来的过平稳问题,做到即使用少量数据也能生动地合成;

3、 突破性还原真人声音及情感表达:将NLP语言预训练模型与TTS声学模型相结合的前后端合成技术,通过将语言模型中潜在的韵律、语义信息提供给声学模型学习,解决录音中语义内容单一的问题,使得合成效果在语义和句式上更加贴切,在跨语境合成中更能契合场景。

语音私有化.png

  百度智能云将充分发挥 AI 技术优势,继续打造智能化创新性服务,助力媒体行业在内容生产上实现更多创新性传播。如果您想要体验AIGC语音合成技术,您可联系在线客服进行预约!


标签: 语音合成

7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

I CP备案号:豫B2-20110005-1

公安备案号: 41010502003271

法律顾问:河南天坤律师事务所-段志刚律师