一些小说平台会配置的有朗诵阅读的模式、一些资讯播报的平台也会有主播进行实时播报、一些打车软件、餐饮叫号等场景下的语音播报、一些智能数码(智能机器人、故事机、平板)等场景下的语音输出形式都是利用语音合成的技术。所以在日常生活中我们也难免会用到语音合成这一技术,下面小编就带大家来学习一下如何调用百度AI语音合成api接口吧!
第一步:创建应用
进入百度智能云后台,登录账号。然后点击【语音技术】-{应用列表},在填写完信息后点击创建应用。创建完会生成APP ID、API KEY、secret key信息。
第二步:临时使用
首先要获取token,注意里面的内容需更换成自己的信息
其次调用api,调用结果在下面网站中实现(注意把里面的内容填充完毕)http://tsn.baidu.com/text2audio?lan=zh&tex=""&ctp=1&cuid=你的用户id&tok=刚刚获取的token值&vol=9&per=106&spd=6&pit=5&aue=3
第三步:使用python脚本调用
首先下载SDK库进行解压安装
其次创建一个Python脚本,注意有需要更改为自己信息的内容
最后进行测试运行(运行成功的话会在同文件夹下生成音频文件,提示缺少模块的话,使用pip3 install <模块名>来安装)
第四步:从txt读入,批量调用
修改刚刚的Python脚本,使之逐行读入text.txt文件,并按照顺序创建audio1.mp3 audio2.mp3 audio3.mp3 ...... (需要现在脚本所在的文件夹下创建result文件夹,生成的语音全部在result文件夹中。如有遗漏的可多次运行。)
百度AI语音合成api接口代码调用:
from aip import AipSpeech
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
def tts(str, id):
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis(str, 'zh', 1, {'spd': 6, 'vol': 9, 'per': 106})
filename = 'result/audio'
if not isinstance(result, dict):
with open(filename + '{}'.format(id) + '.mp3', 'wb') as f:
f.write(result)
text = []
if __name__ == '__main__':
file = open("text.txt")
while True:
lines = file.readlines(100000)
if not lines:
break
for line in lines:
text.append(line)
for i in range(len(text)):
tts(text[i], i+1)
以上就是小编对如何调用百度AI语音合成api接口的分享,有不懂的地方可以随时联系在线客服哦!
7x24小时服务热线:400-996-8756
公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层
法律顾问:河南天坤律师事务所-段志刚律师