[发明专利]基于大数据处理的印刷数据识别方法有效
申请号: | 202111063256.3 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113506297B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 葛峰 | 申请(专利权)人: | 南通天成包装有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/12;G06T7/13;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 郑州知倍通知识产权代理事务所(普通合伙) 41191 | 代理人: | 夏开松 |
地址: | 226000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据处理 印刷 数据 识别 方法 | ||
1.一种基于大数据处理的印刷数据识别方法,该方法包括以下步骤,步骤一:使用语义分割技术将采集到的RGB图像分割得到印刷品图像;步骤二:对标准图像和印刷图像进行处理,得到各自的图像描述;包括:对印刷品图像进行边缘检测,获得对应的边缘图像;提取边缘图像内闭合的连通域;设置初始参数,印刷图像的各连通域分别设置对应的初始值,包括像素个数N=0,层数L=0;极限坐标:;
由于不同图像的像素大小不同,故而连通域的面积参数用该连通域的像素个数与整个图像的总像素个数的比值来表示,即该连通域面积参数S:
;
式中,N为连通域的像素个数,为整个图像的像素个数;
逐行遍历图像的像素点,获得:图像中每行的像素点都有其对应的连通域标签序列,形式如下:
;其中0为背景像素即非连通域像素,0之外的数字为对应连通域的标签号,对标签值进行处理,获得该行下连通域的层次信息,由于一个连通域是一个闭合区域,所以在图像的一行像素上从左到右遍历时,它的标签号要至少出现两次,第一次为开始进入这个连通域,第二次为离开这个连通域,存在嵌套结构的连通域,必然是大连通域包含小连通域,所以连通域的嵌套层数一旦确定是不会改变的,如果,表示对应连通域的嵌套层数未确定,当时,不需要更改L的值,设置一个临时变量C=0,从左向右进行遍历,记录第一个非0数字,上述连通域标签序列中对应的数字为1,其对应的C设置为1,此由于标签号为1的连通域的嵌套层数,所以对应的连通域的嵌套层数L的值更新为C,表示该连通域的最大嵌套层数为1,此时记录下的非0标签序列为;第二个非0数字,上述连通域标签序列中对应的数字为3,已记录的标签序列中不存在数字3,记录该数字,所得标签序列为,此时令,表示进入更深一层的嵌套连通区域中,由于标签号为3的连通域最大嵌套层次,更新,表示标签号为3的连通域的最大嵌套层数为2;第三个非0数字为2,不在已记录的非0标签序列内,将数字2记录进标签序列,此时的非0数字标签序列为,由于标签号2的连通域的嵌套层数,令,表示标签号为2的连通域的最大嵌套层数为3;继续遍历,第四个遍历的非0数字为2,由于之前记录的数字序列中已经存在2,表示标签为2的连通域遍历已经结束,不再将其记录进标签序列;令C减1,此时C=2,即此时遍历的像素点位于嵌套层次为2的连通域中,以此类推,每遇到一个新的连通域,即记录的非0数字标签序列中不存在的标签号,使C加1,表示进入到更深一层的嵌套区域中;每离开一个连通域,令C减1,表示回到上一层的嵌套区域中;另外,在每次对C进行加1操作时,需要判断对应标签号的嵌套层次L是否为0,直到遍历完该行像素,每遍历一个带标签的像素点,就使对应标签的像素个数;比较该带标签的像素点坐标与已有的横纵坐标的最大值和最小值:,,,进行比较,包括:某遍历的标签像素点坐标为,若,则,否则保持不变;若,则,否则保持不变;对同理;遍历结束后,得到中心点坐标,其中;得到,以及各自的嵌套层数L;计算各个连通域整体特征值,用连通域中心点坐标到原点距离以及连通域面积表示:
;
得到每个连通域的描述情况;
步骤三:对比标准图像与印刷图像的图像描述,判断印刷异常的情况。
2.根据权利要求1所述的一种基于大数据处理的印刷数据识别方法,其特征在于对印刷品图像进行边缘检测,获得对应的边缘图像具体包括:输入印刷图像,将图像灰度化处理后,使用Canny算子对图像进行边缘检测,得到梯度边缘,即为印刷区域中图案的边缘。
3.根据权利要求1所述的一种基于大数据处理的印刷数据识别方法,其特征在于,提取边缘图像内闭合的连通域具体包括:对印刷区域中图案的边缘使用种子填充法进行连通域分析,得到具有不同标签的连通域,并得到最大的标签号的值,即总共的数量。
4.根据权利要求1所述的一种基于大数据处理的印刷数据识别方法,其特征在于,连通域描述组合得到该印刷品图像的描述具体为:整个图像的描述表现为
;
同理,对标准图像重复上述操作,得到标准图像的图像描述数据
;
其中为标准图像中的连通域,为连通域个数。
5.根据权利要求1所述的一种基于大数据处理的印刷数据识别方法,其特征在于,步骤三具体为:遍历标准图像和印刷图像的连通域,将其按照层数L进行分组,并分别计算各个层级对应的个数;比较标准图像和印刷图像各个层级的对应个数,个数一致为正常情况,个数不一致的层级需要对该层级内的连通域进一步检测:设置标准图像中的对应连通域标志,整体特征值差距;印刷图像中的对应连通域标志;寻找该层级各连通域之间对应关系:查找印刷图像某个连通域与标准图像中各个连通域的整体特征值之间的差值:
差值最小,即时,对相关的两个连通域即为印刷图像对应标签号的对应连通域与标准图像对应标签号的对应的连通域;
若标准图像连通域标志,表示此时的标准图像中的连通域无对应连通域,更新的值:
;
若标准图像连通域标志,,表示标准图像中的该连通域当前在印刷图像中已存在一个对应连通域,比较该标准图像连通域的与对应连通域对应的差值的大小:
若, 更新的值,令
;
其中,为对应连通域的连通域标志,为标签号,为对应连通域的连通域标志;
若,获得该印刷图像中的对应连通域与标准图像连通域的面积差距;获得对应连通域与标准图像连通域的面积差距;如果对应连通域对应的面积差距相对于对应连通域的面积差距小,则更新的值;否则不更新的值;
若,则不更新的值;
遍历结束后,印刷图像中连通域的对应连通域标志存在两种情况:;
: 表示该连通域在标准图像中不存在对应连通域,即缺陷区域,这种缺陷存在的位置为图案内部和图案外部空白区域,该区域缺陷的整体影响情况为:
: 在标准图像中存在对应连通域,比较二者之间的面积差距,由于存在统计误差,误差在标准图像总面积的3%以内均为正常,超过3%的认为存在异常,存在图案缺印或多印的状况,则这些区域的缺陷整体影响情况为,表示如下:
印刷图像整体存在的缺陷为:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通天成包装有限公司,未经南通天成包装有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111063256.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:排队长度与交通量估算方法、装置、设备及可读存储介质
- 下一篇:一种变压器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置