[发明专利]手写字符样本的生成方法及装置、电子设备、存储介质有效
申请号: | 202110509171.7 | 申请日: | 2021-05-11 |
公开(公告)号: | CN112990205B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张发恩;纪双西;敖川 | 申请(专利权)人: | 创新奇智(北京)科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 字符 样本 生成 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种手写字符样本的生成方法及装置、电子设备、存储介质,该方法包括:获取无字符纹理的背景图片以及不同字符类型的手写字符图片;针对每种字符类型,对字符类型的手写字符图片进行预处理,获得字符类型对应的第一字符掩码图;根据第一字符掩码图,确定字符类型的手写字符图片的字符区域,并对字符区域进行数据增强,获得字符类型对应的第二字符掩码图;从任一字符类型对应的第一字符掩码图和第二字符掩码图中随机选取目标字符掩码图,将目标字符掩码图与背景图片进行融合,得到手写字符样本。由此可以生成多样化的手写字符样本,多样化的手写字符样本,可以提高训练得到字符识别模型的泛化能力,提高模型准确性。
技术领域
本申请涉及自然语言处理技术领域,特别涉及一种手写字符样本的构生成方法及装置、电子设备、计算机可读存储介质。
背景技术
在零售场景进行商品识别任务中,经常需要同时对商品的价格签及相应的价格进行识别。当待识别的价签为超市标准机打价签或电子价签的情况下,通常可使用价签检测——OCR识别技术进行有效解决,但当待识别价签为小超市或社区零售店的手写价签,目前手写字符检测识别方法则通常无法达到很高的识别准确率,主要原因包括:手写字符多样性高(字体、角度)、手写价签背景多样性高(不同背景颜色纹理),手写字符样本数据量小,不同类型数据不均衡性强。
因此,仅通过线上实际拍摄数据构建价签识别模型训练集,通常在实际使用时无法达到很好的泛化性能,某些价签场景识别效果较差,并且通过反复补充实际数据也无法达到稳定快速的识别准确率提升。
发明内容
本申请实施例提供了一种手写字符样本的生成方法,用以实现样本的多样性,提供训练模型的泛化性能。
本申请实施例提供了一种手写字符样本的生成方法,所述方法包括:
获取无字符纹理的背景图片以及不同字符类型的手写字符图片;
针对每种字符类型,对所述字符类型的手写字符图片进行预处理,获得所述字符类型对应的第一字符掩码图;
根据所述第一字符掩码图,确定所述字符类型的手写字符图片的字符区域,并对所述字符区域进行数据增强,获得所述字符类型对应的第二字符掩码图;
从任一字符类型对应的第一字符掩码图和第二字符掩码图中随机选取目标字符掩码图,将所述目标字符掩码图与所述背景图片进行融合,得到手写字符样本。
在一实施例中,获取无字符纹理的背景图片之前,所述方法还包括:
获取存在字符纹理的样本图片;
对所述样本图片进行已有字符的擦除,获得所述无字符纹理的背景图片。
在一实施例中,所述对所述字符类型的手写字符图片进行预处理,获得所述字符类型对应的第一字符掩码图,包括:
将所述手写字符图片转化为灰度图,并对所述灰度图进行单尺度图像增强操作,获得字符边缘图;
对所述字符边缘图进行图像开运算操作,获得所述第一字符掩码图。
在一实施例中,所述根据所述第一字符掩码图,确定所述字符类型的手写字符图片的字符区域,并对所述字符区域进行数据增强,获得所述字符类型对应的第二字符掩码图,包括:
根据所述第一字符掩码图,对所述灰度图进行二值化处理,获得预处理图片;
根据所述第一字符掩码图,获得所述预处理图片的字符区域,对所述字符区域进行数据增强,获得所述第二字符掩码图。
在一实施例中,所述根据所述第一字符掩码图,对所述灰度图进行二值化处理,获得预处理图片,包括:
根据所述第一字符掩码图确定所述灰度图的字符内区域和字符外区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(北京)科技有限公司,未经创新奇智(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110509171.7/2.html,转载请声明来源钻瓜专利网。