[发明专利]一种3D压印字符无分割序列识别方法及系统在审
| 申请号: | 201910060884.2 | 申请日: | 2019-01-23 |
| 公开(公告)号: | CN109919150A | 公开(公告)日: | 2019-06-21 |
| 发明(设计)人: | 游照林;向忠;钱淼;胡旭东 | 申请(专利权)人: | 浙江理工大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
| 代理公司: | 绍兴市知衡专利代理事务所(普通合伙) 33277 | 代理人: | 施春宜 |
| 地址: | 310018 浙江省杭州市杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 压印 序列识别 分割 字符序列 解码 工艺步骤 图像加权 序列特征 字符分割 字符图像 创新性 识别率 显著性 灰度 缺损 污染 变形 融合 检测 | ||
1.一种3D压印字符无分割序列识别方法,其特征在于:包括如下工艺步骤:
1),图像加权融合:根据四副不同曝光强度图像的对比度、饱和度、适度曝光量这三个测度因子生成原始多曝光图像的权重图,对其进行加权平均后获得综合金字塔系数,最后重建拉普拉斯金字塔得到融合图像;
2),区域显著性增强:从非显著像素中选择初始背景种子,让背景种子增长进而检测背景连通域,从而检测出字符连通域;同时利用字符曲率显著性特征来实现字符区域的显著性增强,该操作能够提高步骤1)的融合结果图前景与背景的对比度;
3),无分割序列特征提取:对步骤2)得到的图像使用五层卷积神经网络进行序列特征提取;其中包括二层卷积层,二层最大池化层,一层全连接层;
4),字符序列编码:使用长短时记忆网络(LSTM)来处理和预测步骤3)所提取的序列字符特征;
5),字符序列解码与识别:将步骤(4)的结果输入到基于神经网络的时序类分类的ctc(连接主义时间分类)模块;该模块能够把网络的输出更改为所有可能标签序列的概率分布,通过梯度下降法和反向传播法训练网络,序列解码的目的是找到具有最大概率的近似最优路径,即最佳识别结果。
2.如权利要求1所述的3D压印字符无分割序列识别方法,其特征在于:所述步骤1)中,图像对比度的计算方法采用图像的梯度表示,梯度越大其权值就设置越大,曝光不足、曝光过度区域则梯度值就越小,则其权值就设置越小,计算公式如下:
C(i,j)=F(i-1,j)+F(i+1,j)+F(i,j-1)+F(i,j+1)-4F(i,j)
其中C(i,j)表示像素(i,j)处的梯度,F(i,j)表示在像素(i,j)处的灰度值;
图像饱和度反映彩色图像的鲜艳程度,其计算公式如下:
mu=(R(i,j)+G(i,j)+B(i,j))/3
其中,S(i,j)表示像素(i,j)处的饱和度,R(i,j)、G(i,j)和B(i,j)分别表示彩色图像三通道在像素(i,j)处的取值,mu表示三通道在像素(i,j)处的平均值;
图像所反映的空间频率计算图像的适度曝光量。计算公式如下:
E(i,j)=ER(i,j)gEG(i,j)gEB(i,j)
其中,E(i,j)表示像素(i,j)处的曝光量,ER(i,j)、EG(i,j)EB(i,j)分别表示彩色图像三通道在像素(i,j)处的曝光量,δ为方差,实验取值为0.15;
多曝光图像序列的对比度、饱和度和适度曝光量,利用它们的联合乘积作为图像的权值图,计算公式如下:
其中,表示多曝光图像序列中第k幅图像在像素(i,j)处的权值,和分别表示第k幅图像的对比度、饱和度和适度曝光量,wc、ws和we分别为C、S和E权值的调节参数,实验中全部取1;
高斯金字塔第l层的构造方法如下:
构造的l层图像记为Gl,Gl-1与窗口函数具有低通特性的w进行卷积,通过对它们卷积的结果做隔行隔列的降采样运算得到Gl
其中L表示高斯金字塔层数,Cl为第l层图像列表数,Rl是行数,w(m,n)为5×5窗口函数;
最后,多曝光图像加权融合算法模型的计算公式如下:
R为融合图像,IK为输入的多曝光图像序列,WK为对应的权值,N为多曝光图像序列的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910060884.2/1.html,转载请声明来源钻瓜专利网。





