[发明专利]一种基于机器学习的样本集自动生成方法在审
| 申请号: | 202111118016.9 | 申请日: | 2021-09-23 |
| 公开(公告)号: | CN113887737A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 赵霞;尤相骏;赵飞;齐利军;于重重;苏维均 | 申请(专利权)人: | 北京工商大学;南京数联空间测绘科技有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06T7/11;G06K9/62 |
| 代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 贾晓玲 |
| 地址: | 100048 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 样本 自动 生成 方法 | ||
1.一种基于机器学习的样本集自动生成方法,其步骤包括:
A.根据目标分布特性切分原始图像,得到切分小图;
A1.通过物理设备或者计算手段生成样本集所需要的原始图像;
A2.根据目标的纵向分布特性,横向切分原始图像,得到切分大图;
A3.根据目标横向分布特性切分原始图像,得到切分小图;
B.选择待识别目标图像区域作为模式,调整参数列表进行模式匹配,自动生成样本标注文件,得到标注好的样本集;
B1.在原始图像中为每类待识别目标寻找一个目标图像区域,将其切分出来作为该类目标的匹配模板(简称模式),并保存在模式目录下;
B2.读取模式目录下的每个模式,提取模式信息,构建模式匹配的参数列表;
其中,参数列表中每一行对应一个模式的参数,包括区域id、目标编码、模式编码、目标位置限制范围、匹配度阈值;
B3.根据目标特征增加模式与限制条件,调整模式匹配的参数列表;
B4.遍历模式目录下的每种模式,根据参数列表中对应的模式参数,对匹配目录下的每张切分小图进行模式匹配;
B5.筛选出匹配度大于阈值的待检测图像,作为该切片小图上的目标,其对应的候选框位置作为该样本上标注框的位置;生成与样本图片名称相同的VOC格式的xml文件,将xml文件与样本图片保存在样本集目录下;
C.利用样本增强方法,平衡扩充样本集,生成新增样本标注文件,得到扩充样本集;
C1.选择增强随机光学扰动、增加随机噪声、几何变换三种增强方法生成扩充样本;
C2.统计样本集目录下各类样本的数量,根据每类样本现有数量,设置扩充阈值表Thr1、Thr2、Thr3,分别包含三种方法对应每类样本的扩充数量;
C3.遍历模式目录下的每类样本,根据扩充阈值表Thr1,利用增强随机光学扰动来扩充样本集;
C4.遍历模式目录下的每类样本,根据扩充阈值表Thr2,利用增加随机噪声来扩充样本集;
C5.遍历模式目录下的每类样本,根据扩充阈值表Thr3,利用几何变换方法来扩充样本集;
C6.为上述新增图像生成标注信息xml文件,并将xml文件与图像保存在样本集目录下,得到扩充样本集。
2.如权利要求1所述的基于机器学习的样本集自动生成方法,其特征在于,根据目标特征增加模式与限制条件,调整模式匹配的参数列表,具体步骤如下:
B3.1针对同一类目标存在外观特征差异比较大的情况,对差异较大的目标在模式目录下增加模式;
B3.2针对具有特殊位置的目标,更改目标坐标范围限制,使其完全包含目标;
B3.3根据更改后的模式参数,更新模式匹配的参数列表。
3.如权利要求1所述的基于机器学习的样本集自动生成方法,其特征在于,遍历模式目录下的每种模式,根据参数列表中对应的模式参数,对匹配目录下的每张切分小图进行模式匹配,具体步骤如下:
B4.1以模式的边框作为候选框,从左到右、从上到下在切分小图中以步长T,滑动候选框,得到待检测图像;滑动过程中的待检测图像的左上角在切分小图中的位置,记为(x,y);其中,0≤x≤W-w,0≤y≤H-h,w、h分别为模式的行数和列数,W、H分别为待检测图像的行数和列数;
B4.2运用归一化相关系数匹配法,计算模式与每个待检测图像的匹配度,记为R(x,y),计算公式如下:
其中,T(x′,y′)表示在模式中的像素坐标(x′,y′)处的像素值,(x+x′,y+y′)表在待检测图像中的像素坐标(x+x′,y+y′)处的像素值;表示模式中所有像素值的平均值;表示待检测图像中所有像素值的平均值;
表示对模式中每个像素值与待检测图像中对应点像素值的归一化值乘积求和;
表示对模式中所有像素值平方和与待检测图像中所有像素值平方和的乘积开平方。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;南京数联空间测绘科技有限公司,未经北京工商大学;南京数联空间测绘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111118016.9/1.html,转载请声明来源钻瓜专利网。





