[发明专利]一种在相机失焦情况下的数字检测识别方法有效
申请号: | 202011070896.2 | 申请日: | 2020-10-09 |
公开(公告)号: | CN112183650B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 吴书涵;吴泳 | 申请(专利权)人: | 青岛中瑞车云工业互联网科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06V20/62;G06V30/146;G06V30/18;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 青岛海誉知识产权代理有限公司 37421 | 代理人: | 唐修豪 |
地址: | 266199 山东省青岛市李*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相机 情况 数字 检测 识别 方法 | ||
本发明提供了一种在相机失焦情况下的数字检测识别方法,本发明通过构建带有数字位置和内容标注的数据集,并搭建二级卷积神经网络,使用构建好的数据集训练该网络,从而对数字进行识别检测,本发明充分利用图像序列中的信息,同时使用区域池化操作,使网络专注于学习数字位置处的图像特征,使网络能够更快收敛,且提高了识别率,另外使用二级网络结构,使数字位置和内容监督信息能够监督失焦修正网络的参数更新。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种在相机失焦情况下的数字检测识别方法。
背景技术
图像作为信息交流的载体,获得了广泛的运用,因此从图像中提取信息成为图像处理领域的一个研究方向。其中,检测并识别图像中的数字是图像处理领域的应用之一。传统方法通常使用色彩空间变换、特征算子检测、霍夫变换等方法检测图像中数字的位置,使用模板匹配或者模式识别类的算法识别数字。近年来,随着深度学习的发展,一系列检测算法被提出,比如Faster-RCNN和YOLO等算法,都有着超出传统算法的性能。
然而,图像在采集过程中会遇到质量降低和失真的问题,在许多情况下,比如环境亮度较低或镜头与拍摄物体之间存在相对运动时,会出现相机失焦,获得的图像变模糊等问题,直接使用传统或基于深度学习的数字检测与识别方法处理失焦图像并不能得到较高的准确率,因此,需要针对失焦图像设计一种数字检测与识别方法。
例如使用超分辨率算法,如SRCNN,处理失焦图像并得到清晰图像,然后使用传统或基于深度学习的数字检测与识别算法处理清晰图像。但由于数字和背景的纹理和结构有较大的差异,超分辨率算法的网络参数量往往很大,且需要大量数据作为训练集。在这种情况下,该策略不仅对数字的纹理和结构特点做针对性训练,还耗费了大量计算资源去学习并不需要的背景信息,因此并不能满足数据集较小和处理器性能较差的场景。
发明内容
本发明的目的是提供一种在相机失焦情况下的数字检测识别方法,旨在解决现有技术中失焦情况下图像的数字检测存在参数量过大、计算复杂的问题,实现专注于数字位置处的图像特征提取,提高数字识别率。
为达到上述技术目的,本发明提供了一种在相机失焦情况下的数字检测识别方法,所述方法包括以下操作:
S1、构建带有数字位置和内容标注的数据集;
S2、搭建二级卷积神经网络,进行特征提取、特征融合以及失焦修正得到失焦修正后的图像,再提取位置特征,对位置特征进行修正,识别数字内容和位置;
S3、将采集和生成的数据集训练所述二级卷积神经网络;
S4、在应用时,将图像输入到二级网络中,得到网络输出的数字位置和内容。
优选地,所述步骤S1具体为:
每个场景下采集5张失焦图像和1张对焦正确的图像,并标注图像中数字的位置和内容;
对采集的数据集进行数据增强处理;
生成一串固定长度的随机数字,将随机数字转化为图像,拼接到随机背景上,同时生成图像中数字的位置和内容,并对每一张生成图像通过卷积操作进行失焦处理。
优选地,所述通过卷积操作进行失焦处理具体为:
生成1-7之间的随机整数R,R为卷积核的半径,并生成1-2之间的随机数σ,生成卷积核:
其中,r为(x,y)到卷积核中心的距离,G(x,y)为初步得到的卷积核,F(x,y)为进行归一化处理之后的卷积核,将F(x,y)和生成的图像进行卷积操作,得到失焦图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛中瑞车云工业互联网科技有限公司,未经青岛中瑞车云工业互联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011070896.2/2.html,转载请声明来源钻瓜专利网。