百度语音识别支持实时流上传吗

百度语音识别支持实时流上传吗

发布时间:2024-07-13 作者:创始人

 百度语音识别支持实时流上传吗?是支持的。百度语音识别类别下面有个实时语音识别算法,就是针对实时语音流的,能够将音频流实时识别为文字,适用于长句语音输入、音视频字幕、会议等场景。

实时语音识别api支持的两种输入格式:

1、实时音频流输入:上传必须是实时,不能过快。即整体耗时略多于原始音频流长度。如果因为导致网络不稳定需要发起新请求续传,接口允许超发XXms的录音音频;即此时不必“实时“,可以一下子将需要追溯的音频全部发给服务端。单次调用接口的音频时长目前不超过1小时。

2、音频文件输入:支持pcm格式的音频文件,每160ms为一帧发送,间隔1-2ms,整体耗时短于音频流输入,单次调用接口的音频时长目前不超过1小时。

调用不限编程语言,只要能发送websocket请求即可,推荐在服务器上调用。

1720690821674.jpg

  百度实时语音识别api支持AndroidiOSLinux SDK,可以在多种操作系统、多种设备终端上调用,快速上手,简单易用;此外支持普通话和略带口音的中文识别;支持英文识别。如果您想体验即刻联系在线客服领取测试额度吧!


7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

I CP备案号:豫B2-20110005-1

公安备案号: 41010502003271

法律顾问:河南天坤律师事务所-段志刚律师