百度语音识别技术为广大开发者提供精准、免费、安全、稳定的服务。百度语音技术广泛应用于泛阅读、在线教育、音频审核、电话客服、快递物流等多种行业和场景,赋能开发者,让您的产品能“听”会“说”。很多开发者还不了解百度语音识别技术都有哪些产品,腾佑科技作为百度云河南服务中心,下面就为大家来分享一下百度语音识别包含哪几类。
一、语音识别
1、短语音识别:将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
2、短语音识别极速版:采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一,提升语音交互体验。
3、实时语音识别:将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。
4、音频文件转写:将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景。
二、语音合成
1、短文本在线合成:提供REST API接口、在线SDK,满足手机APP、网页端、小程序、硬件等多场景需求,提供流畅自然的合成体验。
2、长文本在线合成:最高支持10万字文本一次性合成。
3、离线语音合成:提供Android、iOS、HarmonyOS离线语音合成SDK;支持纯离线和离在线融合模式。
三、语音唤醒:支持特定语音指令唤醒,唤醒的同时执行指令操作,轻量级,低功耗,可自定义设置多个唤醒词。
四、语音翻译
1、AI同传:支持中、英、日、韩等多语种同传,目前支持的演讲者语言:中文、英语,同传收听语言:英语、日语、韩语、中文。
2、语音翻译api:可以将60秒以内的语音识别成文字并翻译成目标语言,支持译文语音播报。
3、语音实时翻译:实时语音翻译API支持中英日韩法西泰俄等45个语种。
以上就是百度语音识别包含哪几类的详细介绍,各位开发者可以根据业务需求进行选择,百度语音识别技术还有免费测试额度,您可以联系在线客服进行领取!
7x24小时服务热线:400-996-8756
公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层
法律顾问:河南天坤律师事务所-段志刚律师