百度语音识别包含哪几类

百度语音识别包含哪几类

发布时间:2023-04-10 作者:创始人

 百度语音识别技术为广大开发者提供精准、免费、安全、稳定的服务。百度语音技术广泛应用于泛阅读、在线教育、音频审核、电话客服、快递物流等多种行业和场景,赋能开发者,让您的产品能“听”会“说”。很多开发者还不了解百度语音识别技术都有哪些产品,腾佑科技作为百度云河南服务中心,下面就为大家来分享一下百度语音识别包含哪几类。

一、语音识别

1、短语音识别:60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。

2、短语音识别极速版:采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一,提升语音交互体验。

3、实时语音识别:将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。

4、音频文件转写:将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景。

语音识别实时


二、语音合成

1、短文本在线合成:提供REST API接口、在线SDK,满足手机APP、网页端、小程序、硬件等多场景需求,提供流畅自然的合成体验。

2、长文本在线合成:最高支持10万字文本一次性合成。

3、离线语音合成:提供AndroidiOSHarmonyOS离线语音合成SDK;支持纯离线和离在线融合模式。

三、语音唤醒:支持特定语音指令唤醒,唤醒的同时执行指令操作,轻量级,低功耗,可自定义设置多个唤醒词。

语音识别1


四、语音翻译

1、AI同传:支持中、英、日、韩等多语种同传,目前支持的演讲者语言:中文、英语,同传收听语言:英语、日语、韩语、中文。

2、语音翻译api可以将60秒以内的语音识别成文字并翻译成目标语言,支持译文语音播报。

3、语音实时翻译:实时语音翻译API支持中英日韩法西泰俄等45个语种。

  以上就是百度语音识别包含哪几类的详细介绍,各位开发者可以根据业务需求进行选择,百度语音识别技术还有免费测试额度,您可以联系在线客服进行领取!


7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

I CP备案号:豫B2-20110005-1

公安备案号: 41010502003271

法律顾问:河南天坤律师事务所-段志刚律师