如何调用百度AI语音合成api接口

发布时间：2022-04-18 作者：创始人

一些小说平台会配置的有朗诵阅读的模式、一些资讯播报的平台也会有主播进行实时播报、一些打车软件、餐饮叫号等场景下的语音播报、一些智能数码（智能机器人、故事机、平板）等场景下的语音输出形式都是利用语音合成的技术。所以在日常生活中我们也难免会用到语音合成这一技术，下面小编就带大家来学习一下如何调用百度AI语音合成api接口吧！

语音识别

第一步：创建应用

进入百度智能云后台，登录账号。然后点击【语音技术】-{应用列表}，在填写完信息后点击创建应用。创建完会生成APP ID、API KEY、secret key信息。

第二步：临时使用

首先要获取token，注意里面的内容需更换成自己的信息

其次调用api，调用结果在下面网站中实现（注意把里面的内容填充完毕）http://tsn.baidu.com/text2audio?lan=zh&tex=""&ctp=1&cuid=你的用户id&tok=刚刚获取的token值&vol=9&per=106&spd=6&pit=5&aue=3

第三步：使用python脚本调用

首先下载SDK库进行解压安装

其次创建一个Python脚本，注意有需要更改为自己信息的内容

最后进行测试运行（运行成功的话会在同文件夹下生成音频文件，提示缺少模块的话，使用pip3 install <模块名>来安装）

第四步：从txt读入，批量调用

修改刚刚的Python脚本，使之逐行读入text.txt文件，并按照顺序创建audio1.mp3 audio2.mp3 audio3.mp3 ...... （需要现在脚本所在的文件夹下创建result文件夹，生成的语音全部在result文件夹中。如有遗漏的可多次运行。）

百度AI语音合成api接口代码调用：

from aip import AipSpeech

APP_ID = '你的APP_ID'

API_KEY = '你的API_KEY'

SECRET_KEY = '你的SECRET_KEY'

def tts(str, id):

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis(str, 'zh', 1, {'spd': 6, 'vol': 9, 'per': 106})

filename = 'result/audio'

if not isinstance(result, dict):

with open(filename + '{}'.format(id) + '.mp3', 'wb') as f:

f.write(result)

text = []

if __name__ == '__main__':

file = open("text.txt")

while True:

lines = file.readlines(100000)

if not lines:

break

for line in lines:

text.append(line)

for i in range(len(text)):

tts(text[i], i+1)

以上就是小编对如何调用百度AI语音合成api接口的分享，有不懂的地方可以随时联系在线客服哦！

标签：语音合成语音合成技术语音识别

上一篇：百度AI在养老服务上的应用落地方案

下一篇：面对大量农业数据时，语音识别功能如何高效助力完成？

如何调用百度AI语音合成api接口

热门资讯