实时语音识别sdk

实时语音识别

基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景

  • 小时包预付费 *.2折
    官方价格:1800
    /元/小时
  • 调用时长后付费 *.2折
    官方价格:3
    /元/小时
  • 定制版 咨询
    官方价格:
    /元/小时
  • |功能介绍

|技术领先识别准确

基于Deep Peak2端到端建模,超过10万小时数据训练,多采样率多场景声学建模,近场中文普通话识别准确率达98%

|多语种识别

支持普通话和略带口音的中文识别;支持英文识别

|智能语言处理

使用大规模数据集训练语言模型,对识别中间结果进行智能纠错,并根据语音的内容理解和停顿智能匹配合适的标点符号,。!?

|多种调用方式

支持WebSocket API,支持Android、iOS、Linux SDK,可以在多种操作系统、多种设备终端上调用,快速上手,简单易用

|毫秒级实时识别音频流

首包响应时间毫秒级,并实时展示中间文字结果,快速识别音频流

|文字识别结果支持时间戳

识别返回的文字结果带有时间戳,展示VAD切分句子开始和结束时间,方便进行功能开发

7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

备案号:豫B2-20110005-1

法律顾问:河南天坤律师事务所-段志刚律师