[发明专利]识别数码管文本的方法、装置及电子设备在审
申请号: | 202110053318.6 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112861861A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 王宗会;杨林;尹恒;郭峰 | 申请(专利权)人: | 珠海世纪鼎利科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/46 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 刘明华 |
地址: | 519000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 数码管 文本 方法 装置 电子设备 | ||
本申请涉及识别数码管文本的方法、装置及电子设备,属于字符识别技术领域,本申请识别数码管文本的方法包括,获取目标设备的现场采集图像;从预先构建的模型图库中选取与该目标设备相匹配的设备模型图,根据设备模型图对现场采集图像进行识别扣取,得到待识别区域图像;基于待识别区域图像,采用预先构建并训练好的数码管文本识别模型进行文本识别,得到文本识别结果;根据与设备模型图相关联的文本属性配置信息和所述文本识别结果进行匹配组合处理,将组合得到结构化数据作为最终识别结果。本申请更好的实现了对数码管显示的识别。
技术领域
本申请属于字符识别技术领域,具体涉及一种识别数码管文本的方法、装置及电子设备。
背景技术
光学字符识别OCR一般是指使用电子设备(扫描仪、数码相机等)检查纸上打印的文字,通过检测明暗和形状,使用字符识别技术,将其翻译成文字的过程。传统OCR识别应用广泛使用Tesseract-OCR,该软件是惠普公司布里斯托尔实验室在1984-1994年开发完成的,最初作为惠普的平板扫描仪的文字识别引擎。1995年UNLV OCR字符识别准确性测试中获得第一而受到广泛关注。1994年后因惠普放弃OCR市场停止开发。2005年惠普将Tesseract-OCR贡献给开源社区。Google获得该源码开始对其进行功能扩展及优化。
在复杂场景下,进行OCR识别(如商品照片品牌识别、网页信息识别、自动驾驶路牌识别、标准证件识别、车牌识别等),其核心算法主要由文本检测、字符分割和字符识别三部分组成(部分神经网络不需要字符分割)。
文件检测方法分为图形图像学定位和机器学习定位,图形学定位分颜色定位、纹理定位、边缘检测、数学形态,但图形图像学定位方法容易受到外界干扰信息的干扰造成定位失败。如颜色分析的定位方法,如果车牌背景颜色与车牌颜色相近,就很难从背景中提取车牌;边缘检测的方法,目标边缘的污损也很容易造成定位失败。外界干扰信息的干扰也会欺骗定位算法,使得定位算法生成过多的错误待识别目标候选区域,增大系统负荷。文本字符分割车牌、标准证件一般采用垂直投影法,因为字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,且这个位置应满足车牌的字符书写格式、字符、尺寸限制和一些其他条件,因此利用垂直投影法对复杂环境下的汽车图像中的字符分割有较好的效果。字符识别方法主要有模板匹配算法和人工神经网络算法,模板匹配算法先将分割后的字符与所有的模板进行匹配,最后选取最佳匹配作为结果。人工神经元网络的算法有两种:一种是先将文本字符拆分单个字符,将字符作为输入训练神经网络分配器,以此实现识别;另一种是直接将文本字符整个传入训练好的神经网络,由网络通过特征提取实现整个文本快识别,此方法应用较为广泛,网络结构有:CRNN、CNN+CTCOCR、DenseNet+CTC等。
如上所述,传统和复杂场景OCR在实际应用中已经有了好的解决方案和实现,但在具体场景中,现有相关技术中对设备显示屏幕上数码管显示文本(包括以数码管字体显示的文本)的识别效果很不理想。
具体的,传统OCR主要针对打印纸类型文字识别,对于简单场景,文字与背景差异大,二值化场景效果显著;而实际应用场景,干扰因素多,原始图片包含整个设备与运行环境,识别时受明暗、角度、颜色等多种因素影响,常把无关信息识别为有用信息,无法有效提取文字目标,且现有模型不支持七段数码管文字识别。
而复杂场景OCR识别功能上支持七段数码管目标定位,但无算法模型支持,设计、训练、优化网络需要大量时间,训练需要大量全量设备类型,不同明暗、角度、颜色等场景的有效标注图片,这部分工作需要大量人力物力,现场无法提供,训练好的网络需要不断验证优化,当有新类型设备加入时,需要重新训练网络,并验证优化,在需要快速开发时,此部分工作量无法估量。同时其也存在已有模型不支持七段数码管文本识别的缺陷,因此复杂场景OCR功能上支持,但从设计实现到优化需要大量工作,且无法保证识别效果,且识别结果为一段文本,没有任何数据属性业务信息。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海世纪鼎利科技股份有限公司,未经珠海世纪鼎利科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110053318.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能手环壳体防错位固定治具
- 下一篇:一种用于游戏机的自动包装设备