[发明专利]一种基于机器学习的样本集自动生成方法在审

专利信息
申请号: 202111118016.9 申请日: 2021-09-23
公开(公告)号: CN113887737A 公开(公告)日: 2022-01-04
发明(设计)人: 赵霞;尤相骏;赵飞;齐利军;于重重;苏维均 申请(专利权)人: 北京工商大学;南京数联空间测绘科技有限公司
主分类号: G06N20/00 分类号: G06N20/00;G06T7/11;G06K9/62
代理公司: 北京万象新悦知识产权代理有限公司 11360 代理人: 贾晓玲
地址: 100048 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 样本 自动 生成 方法
【说明书】:

本发明公开了一种基于机器学习的样本集自动生成方法,将样本集自动生成过程分为:1)根据目标分布特性切分原始图像,得到切分小图;2)选择待识别目标图像区域作为模式,调整参数列表进行模式匹配,自动生成样本标注文件,得到标注好的样本集;3)利用样本增强方法,平衡扩充样本集,生成新增样本标注文件,得到扩充样本集。本发明从原始图像的处理出发,实现了样本自动切割与目标定位,并辅以样本增强方法平衡样本数量,为样本集的构建提供了自动化解决方案,提高了样本集构建效率,有较高的应用价值和推广价值。

技术领域

本发明涉及样本集的自动生成,具体涉及一种基于机器学习的样本集自动生成方法,属于机器学习与人工智能应用领域。

背景技术

随着人工智能的快速发展,机器学习模型越来越广泛的应用于社会生产生活的各个领域。机器学习模型的开发一般可以分为样本集制作、模型结构设计、模型训练、模型评估四步。其中样本集制作是模型训练的基础,样本集的数量和质量都对模型的性能起着决定性影响。现有的样本集制作工作量大且严重依赖于人工,耗费研究人员大量精力,浪费公司大量资金,是机器学习领域面临的共同问题。因此实现样本集的自动化构建对提高模型训练质量以及缩短模型制作周期至关重要,并且将为机器学习模型的研发提供极大的便利。

现有的样本集制作主要采用使用辅助工具对原始图像进行人工标注的方式。专利CN113160231A首先通过人工获取目标物体的至少一张物体图像,然后基于所述目标物体,分别对各张物体图像进行目标分割,得到至少一张分割图像,最后基于至少一张分割图像与预设的背景图像,生成训练样本集。通过更换背景的方式生成的样本集,存在样本中目标形态单调、图像像素不连贯、样本干扰因素少等缺点,将会影响模型训练质量。并且制作过程中初始目标的定位、分割依然采取人工识别的方式,并没有真正实现样本集的自动生成。

目前基于机器学习的模式匹配方法经过调参可以准确、快速的在原始图像中定位目标进行自动标注,无需人工识别,且标注后的样本集通过样本增强的扩充,可以获得样本形态丰富、像素连贯的优质样本集。

发明内容

本发明的目的在于实现一种基于机器学习的样本集自动生成方法,该方法包括:1)根据目标分布特性切分原始图像,得到切分小图;2)选择待识别目标图像区域作为模式,调整参数列表进行模式匹配,自动生成样本标注文件,得到标注好的样本集;3)利用样本增强方法,平衡扩充样本集,生成新增样本标注文件,得到扩充样本集;具体来说,本发明的方法包括下列步骤:

A.根据目标分布特性切分原始图像,得到切分小图,具体步骤如下:

A1.通过物理设备或者计算手段生成样本集所需要的原始图像;

A2.根据目标的纵向分布特性,横向切分原始图像,得到切分大图,具体步骤如下:

A2.1观察原始图像内目标纵向位置分布情况,确定完全包含目标的最小区域,称为切分区域;

A2.2提取切分区域上下边界的像素坐标,称为边界坐标;

A2.3根据边界坐标切分原始图像,得到包含目标的图像区域,将切分区域保存为切分图像目录下的图像文件,称为切分大图;

A3.根据目标横向分布特性切分原始图像,得到切分小图,具体步骤如下:

A3.1根据目标在原始图像中的横向分布特性,确定完全包含目标的纵向切分规则;

A3.2按照纵向切分规则,提取纵向切分位置的像素坐标,称为纵向坐标;

A3.3读取切分图像目录下的每张切分大图,并根据纵向坐标进行切分,将切分后的图像,称为切分小图,保存在匹配目录下;

B.选择待识别目标图像区域作为模式,调整参数列表进行模式匹配,自动生成样本标注文件,得到标注好的样本集,具体步骤如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;南京数联空间测绘科技有限公司,未经北京工商大学;南京数联空间测绘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111118016.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top