百度IOCR什么意思?和OCR有什么区别?

百度IOCR什么意思?和OCR有什么区别?

发布时间:2022-03-01 作者:创始人

  百度IOCR即百度IOCR自定义模板文字识别,是属于OCR的定制产品。分类器和识别模板可由用户自主创建,可以对不同结构的票据卡证进行自动分类并结构化输出识别结果。百度IOCR自定义模板文字识别是给用户提供三部分自定义功能的:

一、自定义模板

比如我们想要识别某类型图片的图片板式,我们就可以上传一张模板图片,通过框选参照字段和识别区即可自助制作一个识别模板,并建立图片中文字的 Key-Value 对应关系,实现对相同版式图片的结构化识别。

二、自定义分类器

针对已发布的多个识别模板,只需每类上传 30 张训练集图片或填写分类关键词即可创建分类器,实现对不同版式图片的自动分类,省去人工分类成本,一步实现图片的自动分类和结构化识别

三、自定义字段类型

针对输出值为有限集的字段,用户可将可能的输出值汇总为字段词典进行上传,在框选识别区后选择该字段类型,系统则会对识别结果进行智能匹配或纠正,用于规范识别结果,并提高识别准确率。

以上讲述的是百度IOCR通用版,除了这个版本之外还有一款财会版;百度IOCR财会版是针对银行单据和各类发票进行专项整合。

自定义模板流程icor

百度IOCR财会版应用案例:

核心痛点:移动设计院员工出差报销时,需要把车票、住宿发票等其他消费的消费信息录入到系统中,然后财务再进一步核对,员工录入和财务核对这两个步骤及其的繁琐且耗时,极大的影响了工作效率,所以移动设计院需要能够解决录入准确率低、校对耗时的这些痛点。

解决方案:移动设计院的报账系统接入百度IOCR财会版,自动提取各类票据上面的信息的同时还可以自动生成报销时所需要的信息,轻轻松松的解决了员工录入信息速度慢、准确率低的问题,也解决了财务一一核对影响工作效率的问题。

  目前,财务票据识别、医疗票据识别、卡证文件电子化都在应用百度IOCR自定义模板文字识别,其中各类票据的识别准确率可达95%,卡证票据的分类准确率可达99%以上。

标签: OCR 文字识别