[发明专利]一种基于不均衡数据集的地下金属目标分类方法及系统有效

专利信息
申请号: 202310064110.3 申请日: 2023-02-06
公开(公告)号: CN115795353B 公开(公告)日: 2023-04-21
发明(设计)人: 张晓彤;石浩东;万亚东;王小芬;王鹏;刘雯;侯浩楠 申请(专利权)人: 北京科技大学
主分类号: G06F18/24 分类号: G06F18/24;G06N20/10;G06N20/00;G06N3/0475;G06N3/094
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 付忠林;张仲波
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 均衡 数据 地下 金属 目标 分类 方法 系统
【权利要求书】:

1.一种基于不均衡数据集的地下金属目标分类方法,其特征在于,包括:

获取地下金属目标样本数据,构建样本数据库;其中,所述样本数据库中的每个地下金属目标样本数据分别包括探测时,掩埋地下金属目标的地上区域内的探测设备根据时序接收到的衰减的磁场强度数据和地下金属目标的类别;

采用预设的特征提取算法对所述样本数据中的各磁场强度数据分别进行特征提取,得到磁场强度衰减规律特征数据,作为相应样本对应的样本特征数据;

对所述样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,自适应地构建多个平衡样本数据集;

利用所述平衡样本数据集对多个预设的机器学习模型分别进行训练,得到多个地下金属目标分类子模型;其中,所述地下金属目标分类子模型的输入为样本特征数据,输出为样本特征数据对应的地下金属目标的类别;

集成各个地下金属目标分类子模型,得到最终的地下金属目标分类模型;

利用所述地下金属目标分类模型得到待测的地下金属目标对应的类别;

对所述样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,自适应地构建多个平衡样本数据集,包括:

对所述样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,将地下金属目标的类别分为样本数量较少的类别和样本数量较多的类别;其中,样本数量较少的类别指的是样本数量小于预设阈值的类别,样本数量较多的类别指的是样本数量不小于预设阈值的类别;

对样本数量较多的类别对应的样本数据进行欠采样,得到多数类样本;对样本数量较少的类别对应的样本数据进行随机采样,然后生成新样本,并进行过采样,得到少数类样本,通过生成新样本,并进行过采样使得少数类样本数量和多数类样本数量的差异在预设范围内,从而得到多个平衡的样本数据集;

利用所述平衡样本数据集对多个预设的机器学习模型分别进行训练,包括:

将各平衡样本数据集按照7:3的比例划分训练集和测试集,对于每个预设的机器学习模型,基于所述训练集和所述测试集,利用交叉验证的方法,调整机器学习模型中的参数,获得对应的训练好的地下金属目标分类子模型;

所述机器学习模型为逻辑回归模型、决策树模型、支持向量机模型、人工神经网络模型和k近邻模型中的任意一种或多种的组合;

所述集成各个地下金属目标分类子模型,包括:

基于相对G-mean加权策略,基于各地下金属目标分类子模型的相对G-mean指标设置各地下金属目标分类子模型的权重,集成各地下金属目标分类子模型。

2.如权利要求1所述的基于不均衡数据集的地下金属目标分类方法,其特征在于,所述磁场强度数据通过指数级间隔的时序进行采样获取。

3.如权利要求1所述的基于不均衡数据集的地下金属目标分类方法,其特征在于,所述特征提取算法为线性判别分析法、主成分分析法或统计分析法。

4.如权利要求1所述的基于不均衡数据集的地下金属目标分类方法,其特征在于,所述新样本采用合成少数类过采样SMOTE算法或生成对抗网络算法生成。

5.如权利要求1所述的基于不均衡数据集的地下金属目标分类方法,其特征在于,利用所述地下金属目标分类模型得到待测的地下金属目标对应的类别,包括:

在掩埋待测的地下金属目标的地上区域内,利用探测设备实时采集待测的地下金属目标对应的衰减的磁场强度数据;

采用预设的特征提取算法对实时采集到的待测的地下金属目标对应的衰减的磁场强度数据进行特征提取,得到磁场强度衰减规律特征数据;

将得到的磁场强度衰减规律特征数据输入所述地下金属目标分类模型,通过所述地下金属目标分类模型输出待测的地下金属目标对应的类别。

6.一种基于不均衡数据集的地下金属目标分类系统,其特征在于,所述基于不均衡数据集的地下金属目标分类系统包括:

样本数据库构建模块,用于获取地下金属目标样本数据,构建样本数据库;其中,所述样本数据库中的每个地下金属目标样本数据分别包括探测时,掩埋地下金属目标的地上区域内的探测设备根据时序接收到的衰减的磁场强度数据和地下金属目标的类别;

特征数据提取模块,用于采用预设的特征提取算法对所述样本数据库构建模块所构建的样本数据中的各磁场强度数据分别进行特征提取,得到磁场强度衰减规律特征数据,作为相应样本对应的样本特征数据;

多平衡数据集构建模块,用于对所述样本数据库构建模块所构建的样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,自适应地构建多个平衡样本数据集;

多地下金属目标分类子模型训练模块,用于利用所述多平衡数据集构建模块所构建的平衡样本数据集对多个预设的机器学习模型分别进行训练,得到多个地下金属目标分类子模型;其中,所述地下金属目标分类子模型的输入为样本特征数据,输出为样本特征数据对应的地下金属目标的类别;

地下金属目标分类模型集成模块,用于集成各个地下金属目标分类子模型,得到最终的地下金属目标分类模型;

地下金属目标分类模型应用模块,用于利用所述地下金属目标分类模型集成模块得到的地下金属目标分类模型得到待测的地下金属目标对应的类别;

对所述样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,自适应地构建多个平衡样本数据集,包括:

对所述样本数据库中不同类别地下金属目标的样本数量进行统计,根据不同类别地下金属目标的样本数量,将地下金属目标的类别分为样本数量较少的类别和样本数量较多的类别;其中,样本数量较少的类别指的是样本数量小于预设阈值的类别,样本数量较多的类别指的是样本数量不小于预设阈值的类别;

对样本数量较多的类别对应的样本数据进行欠采样,得到多数类样本;对样本数量较少的类别对应的样本数据进行随机采样,然后生成新样本,并进行过采样,得到少数类样本,通过生成新样本,并进行过采样使得少数类样本数量和多数类样本数量的差异在预设范围内,从而得到多个平衡的样本数据集;

利用所述平衡样本数据集对多个预设的机器学习模型分别进行训练,包括:

将各平衡样本数据集按照7:3的比例划分训练集和测试集,对于每个预设的机器学习模型,基于所述训练集和所述测试集,利用交叉验证的方法,调整机器学习模型中的参数,获得对应的训练好的地下金属目标分类子模型;

所述机器学习模型为逻辑回归模型、决策树模型、支持向量机模型、人工神经网络模型和k近邻模型中的任意一种或多种的组合;

所述集成各个地下金属目标分类子模型,包括:

基于相对G-mean加权策略,基于各地下金属目标分类子模型的相对G-mean指标设置各地下金属目标分类子模型的权重,集成各地下金属目标分类子模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310064110.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top