[发明专利]一种智能无透镜文字识别系统在审
申请号: | 202210246740.8 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114596571A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 张颖而;皇甫江涛 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/162;G06V30/146;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 透镜 文字 识别 系统 | ||
1.一种智能无透镜文字识别系统,其特征在于,包括光学模块和计算成像及文字定位识别模块,光学模块主要由平行放置的可调制幅度掩膜板和光学传感器组成,待识别目标放置于光学模块前方,待识别目标发出的光线经可调制幅度掩膜板散射后,在光学传感器的平面上投射形成投影图像,光学传感器将投影图像传输至计算成像及文字定位识别模块;
可调制幅度掩膜板上的图案通过液晶显示器显示,掩模版上的图案随机生成或通过训练优化后确定;
计算成像及文字识别模块包括计算成像模型、文字定位模型和文字识别模型,三个模型串行连接;计算成像及文字识别模块的输入为经光学模块后在传感器上得到的投影图像,输出为投影图像上文字的文本形式。
2.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,所述的可调制幅度掩膜板为由k*k个单元格组成的二值化掩膜版,每个单元格的值为1或0,1表示光线能通过,0表示光线不能通过。
3.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,投影图像经计算成像模型输出预测的重建图像;文字定位模型对输入的重建图像进行处理,输出图像中文字的位置;将文字定位模型的输出结果输入文字识别模型后,输出图像的文字识别结果;
计算成像及文字识别模块训练过程中,仅计算成像模型参与训练,文字定位模型和文字识别模型不参与训练。
4.根据权利要求3所述的一种智能无透镜文字识别系统,其特征在于,计算成像模型为编码器-解码器体系的神经网络,具体采用U-NET;文字定位模型采用任意文字定位模型结构,具体采用CTPN;文字识别模型采用任意文字识别模型结构,具体采用CRNN。
5.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,通过训练优化后确定掩模版图案的方法包括以下步骤:
1)将待识别目标与光学模块的成像过程建模为二维卷积层,具体为:
m=w*o
其中,w表示掩模版上的幅度分布,即掩模版上单元格的值分布;以掩模版中心点为原点构建坐标系,(i,j)为掩膜板上单元格中心点的坐标,wi,j表示掩膜板上坐标为(i,j)的单元格的值;
o表示待识别目标不经过掩模版时在传感器平面上缩放后的图像;以传感器平面中心点为原点构建坐标系,(x,y)表示投影图像的像素点在传感器平面上的坐标值,ox,y表示待识别目标不经过掩模版时在传感器平面的(x,y)处的像素值;ox+i,y+j表示在传感器平面上(x+i,y+j)处的像素值;
m表示待识别目标经过掩模版后投影在传感器平面上的图像;mx,y表示待识别目标经过掩模版后在传感器平面的(x,y)处的像素值;
k表示掩模版上单元格的行数或列数,i∈[1,k];
2)将二维卷积层进行二值化得到二值神经网络二维卷积层,结果如下:
其中,
其中,wb表示对w进行二值化处理后的结果;
3)将二值神经网络二维卷积层的参数wb作为模型参数与计算成像及文字定位识别模块一同训练优化;
3.1)训练过程中,通过电路调整对掩膜板的图案做随机初始化,并将随机初始化的结果作为二值神经网络卷积层的初始参数;
3.2)系统前向传播过程的训练:固定待识别目标,在真实物理场景中测量待识别目标经掩膜版后在光学传感器的平面上得到的投影图像,并将其作为计算成像及文字定位识别模块的输入;
反向传播过程的训练:计算成像及文字定位识别模块输出的预测图像与真实图像标签的损失函数Loss,将损失函数Loss反向传播至二值神经网络卷积层,更新二值神经网络卷积层参数wb,并根据更新的参数wb调制可调掩膜版,调制结果作为下一轮训练时模型前向传播过程中的掩膜版图案;
3.3)训练完成后得到的掩膜版图案为优化后的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210246740.8/1.html,转载请声明来源钻瓜专利网。