[发明专利]一种用于图片训练集构建的方法与设备在审
申请号: | 202110475978.3 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113191430A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 孔欧;刘益东;王君 | 申请(专利权)人: | 上海蜜度信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 201204 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 图片 训练 构建 方法 设备 | ||
本申请的目的是提供一种用于图片训练集构建的方法与设备。与现有技术相比,本申请通过获取第一原始图片及第二原始图片,其中,所述第二原始图片的高大于第一原始图片,并按照从上到下的顺序将第一原始图片依次覆盖第二原始图片,生成用以训练的图片,然后将生成的多个用以训练的图片作为图片训练集中的图片。通过这种方式进行训练集的构建,能够使训练集在训练后更适用于对特定图片的识别,例如,提高对微博图片的识别效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种用于图片训练集构建的技术。
背景技术
对于微博图片的识别,例如,对于微博火灾图片的识别,一般不采用数据增强的方式,或者使用传统的数据增强方式,而在传统的数据增强方面一般采用:去均值,加入噪声,旋转等操作,并没有考虑到微博图片的特殊性,从而对于微博中出现的特殊形式的图片,无法分类或者分类效果极差。
发明内容
本申请的目的是提供一种用于图片训练集构建的方法与设备。
根据本申请的一个方面,提供了一种用于图片训练集构建的方法,其中,所述方法包括:
获取第一原始图片及第二原始图片,其中,所述第二原始图片的高大于第一原始图片;
按照从上到下的顺序将第一原始图片依次覆盖第二原始图片,生成用以训练的图片;
将生成的多个用以训练的图片作为图片训练集。
可选地,其中,所述第一原始图片为,所述第二原始图片为白色图片。
可选地,其中,所述第二原始图片为包含文字的图片,所述第一原始图片为不包含文字的图片。
可选地,其中,所述第一原始图片之间的间隙为预设像素。
可选地,其中,所述第一原始图片的宽与所述第二原始图片相同,所述第二原始图片的高为所述第一原始图片的预设倍数。
可选地,其中,所述方法还包括:
将所述图片训练集输入神经网络模型进行训练,直至所述神经网络模型的识别图片上文字的准确率达到预设阈值
根据本申请的另一方面,还提供了一种用于图片训练集构建的设备,其中,所述设备包括:
第一装置,用于获取第一原始图片及第二原始图片,其中,所述第二原始图片的高大于第一原始图片;
第二装置,用于按照从上到下的顺序将第一原始图片依次覆盖第二原始图片,生成用以训练的图片;
第三装置,用于将生成的多个用以训练的图片作为图片训练集中的图片。
根据本申请的再一方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述方法的操作。
与现有技术相比,本申请通过获取第一原始图片及第二原始图片,其中,所述第二原始图片的高大于第一原始图片,并按照从上到下的顺序将第一原始图片依次覆盖第二原始图片,生成用以训练的图片,然后将生成的多个用以训练的图片作为图片训练集中的图片。通过这种方式进行训练集的构建,能够使训练集在训练后更适用于对特定图片的识别,例如,提高对微博图片的识别效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于图片训练集构建的方法流程图;
图2示出根据本申请另一个方面的一种用于图片训练集构建的设备示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蜜度信息技术有限公司,未经上海蜜度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110475978.3/2.html,转载请声明来源钻瓜专利网。