百度AI语音实时显示采用websocket协议的连接方式,上传音频的同时文字识别结果同步显示,目前有Java、Android、Python、C++的编程语音。适用于直播质检、会议记录、音视频字幕、长句语言输入等场景,能够识别普通话、英文。
百度AI语音实时显示的两种格式:
1、实时音频流输入:上传必须要是实时的,不宜过快。总的来说总体耗时会多于原始音频流的时长。
2、音频文件输入:支持pcm格式的音频文件,每160ms为一帧发送,间隔1-2ms,整体耗时短于音频流输入,单次调用接口的音频时长目前不超过1小时。
百度AI语音实时显示要求环境的安静程度,且语速正常不能多个人同时发音,所以在嘈杂的环境、有背景音乐或者是合成的音频、远场景语音这些场景的情况下,识别效果准确率会下降甚至有识别不出来的情况。百度AI语音实时显示还针对某些专业领域名词识别不准的情况,客户可使用模型训练(上传文本或词汇后即可训练)。
产品可预付费和后付费两种模式:
1、预付费:比较适用于时长可预估的企业,具有10小时的免费时长。1000小时1800元、10000小时15000元、100000小时120000元。
2、后付费:适用于时长无法预估的企业,具有10小时免费时长。继续使用收费为3元/小时。
百度AI语音实时显示可以助您精准快速识别,快速上手,简单易用!
7x24小时服务热线:400-996-8756
公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层
法律顾问:河南天坤律师事务所-段志刚律师