OCR文字识别技术介绍之机器视觉
OCR文字识别技术是什么?
英文全称Optical Character Recognition,简称OCR,中文叫做光学字符识别。它是利用光学技术和计算机技术把喷印在或写在纸上的文字读取出来,并转换成一种计算机能够识别并接受、人又可以理解的格式信息。
OCR技术的发展
在一些简单环境下OCR的准确度已经比较高了如电子文档,但是在一些复杂环境下的字符识别,还有待技术的进一步升级。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。OCR传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。
OCR字符识别技术的应用场景
OCR字符识别技术广泛应用于银行票据、文献资料录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。在机器视觉领域,OCR同样具有多方面的应用,通过工业相机、工业镜头拍摄文字图像,运用机器视觉软件进行相应处理以获取我们需要的信息,常见的应用有:
1、仪器仪表上的数据读取,如居民生活中得到水表、气表、电表的数值读取;
2、产品的日期、批号读取,获得产品的过期信息及可追溯信息;
3、智能交通的车牌识别,获取违章车辆的信息。
机器视觉方面的OCR应用
1、检测条码/字符印刷缺陷、完整度
2、检测条码/字符的对错、是否漏印
3、检测物体的方向是否正确
4、静态或动态检测
5、OK/NG产品系统输出相应控制信号。