百度通用场景OCR文字识别详解

百度通用场景OCR文字识别详解

发布时间:2023-01-09 作者:创始人

  通用场景文字识别多用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景,然而百度通用场景OCR文字识别技术有很多的小分类,不同分类实现的识别效果不同,下面我们一起来看一下吧!

1、通用文字识别(高精度版)

支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。

2、通用文字识别(高精度版含位置)

在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。

3、通用文字识别(标准版)

对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测。

4、通用文字识别(标准版含位置)  

在通用文字识别(标准版)的基础上,返回文字在图片中的位置信息,方便进行版式的二次处理。

文字识别含位置


5、网络图片文字识别(基础版)       

支持识别艺术字体或背景复杂的文字内容,仅返回文字信息。

6、网络图片文字识别(含位置版)

除文字信息外,还可返回文字的位置信息、行置信度、单字符内容和位置等。

7手写文字识别

检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上

8、办公文档识别

可对办公类文档的版面进行分析,输出图、表、标题、文本、目录、栏、页眉、页脚、页码和脚注的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言,手写、印刷体混排多种场景。

9、表格文字识别

支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持单图中多表格内容的识别。

10、印章识别  

检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,支持圆形章、椭圆形章、方形章等常见印章。                

11、二维码识别  

对图片中的二维码、条形码进行检测和识别,自动返回存储的内容。

二维码识别

    

12、数字识别

识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景

  以上就是百度通用场景OCR文字识别所支持识别的产品,同时提供在线api调用接口、离线SDK、私有化部署等使用方式,欢迎有需求的您联系在线客服进行咨询!


7x24小时服务热线:400-996-8756

公司地址:河南省郑州市姚砦路133号金成时代广场6号楼13层

I CP备案号:豫B2-20110005-1

公安备案号: 41010502003271

法律顾问:河南天坤律师事务所-段志刚律师