[发明专利]图片预处理方法、文字识别模型训练方法和文字识别方法在审
| 申请号: | 202011573687.X | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112613510A | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 张发恩;张建伟 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
| 地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 预处理 方法 文字 识别 模型 训练 | ||
1.一种图片预处理方法,其特征在于,包括:
获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;
根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;
根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。
2.根据权利要求1所述的方法,其特征在于,所述根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片,包括:
根据所述输入像素数量确定出第一目标扩充列数,所述第一目标扩充列数小于所述输入像素数量;
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。
3.根据权利要求2所述的方法,其特征在于,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的背景的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。
4.根据权利要求2所述的方法,其特征在于,所述以所述待处理图片第一边缘为起点,向所述待处理图片的第一边扩充所述第一目标扩充列数的列像素,以得到所述扩充图片,包括:
以所述待处理图片第一边缘为起点,向所述待处理图片的第一边以所述待处理图片的第一边缘的像素点作为扩充像素点,扩充所述第一目标扩充列数的列像素,以得到所述扩充图片。
5.根据权利要求1所述的方法,其特征在于,所述根据所述输入像素数量对所述待处理图片进行像素扩充,包括:
根据预设的图片剪切方式,确定出对所述待处理图片的剪切起点;
根据所述剪切起点和所述输入像素数量确定出第二目标扩充列数,所述第二目标扩充列数小于所述输入像素数量;
以所述待处理图片的剪切起点为扩充起点,向所述待处理图片的第一边扩充第二目标扩充列数的列像素,以得到所述扩充图片。
6.根据权利要求5所述的方法,其特征在于,所述根据所述剪切起点和所述输入像素数量确定出第二目标扩充列数,包括:
根据所述剪切起点确定出所述待处理图片的有效像素列数;
根据所述有效像素列数以及所述输入像素数量,确定出所述第二目标扩充列数。
7.一种文字识别模型训练方法,其特征在于,包括:
使用权利要求1-6任意一项所述的图片预处理方法对训练数据集中的各个图片进行处理,得到的扩充训练图片集;
使用所述扩充训练图片集对初始识别模型进行训练,以得到文字识别模型,所述初始识别模型为一卷积循环神经网络模型。
8.一种文字识别模型训练方法,其特征在于,包括:
使用权利要求1-6任意一项所述的图片预处理方法对训待识别图片进行处理,得到的扩充识别图片;
将所述扩充识别图片输入权利要求7所述的文字识别模型训练方法训练得到的文字识别模型进行识别,以得到文字识别结果。
9.一种图片预处理装置,其特征在于,包括:
第一确定模块,用于获取待处理图片,所述待处理图片为用于输入卷积循环神经网络模型中进行处理的图片,所述卷积循环神经网络模型使用的损失函数为CTC损失函数;
第二确定模块,用于根据所述卷积循环网络模型确定出每一输出值对应的输入像素数量;
第一扩充模块,用于根据所述输入像素数量对所述待处理图片进行像素扩充,以得到扩充图片。
10.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011573687.X/1.html,转载请声明来源钻瓜专利网。





