[发明专利]面向二噁英检测的概率密度分布驱动虚拟样本生成方法在审
申请号: | 202210271839.3 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114757090A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 汤健;王丹丹;乔俊飞 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06F111/06;G06F119/02 |
代理公司: | 北京鑫瑞森知识产权代理有限公司 11961 | 代理人: | 马云华 |
地址: | 100020 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 二噁英 检测 概率 密度 分布 驱动 虚拟 样本 生成 方法 | ||
1.一种面向二噁英检测的概率密度分布驱动虚拟样本生成方法,其特征在于,包括以下步骤:
S1,基于约简特征PDF生成虚拟样本输入:采用主成分分析PCA对DXN建模小样本进行特征降维,对获得的主成分进行核密度估计后再根据分布估计结果生成候选虚拟主成分,对通过正交采样获得的虚拟主成分进行重构以获得DXN虚拟样本输入;
S2,基于集成映射模型生成虚拟样本输出:使用随机森林RF与随机权神经网络RWNN构建集成映射模型以获得DXN虚拟样本输出;
S3,基于CLPSO优化虚拟样本生成过程超参数:采用综合学习粒子群优化算法对影响虚拟样本“优劣”的主成分贡献率、KDE平滑指数、候选虚拟主成分和虚拟样本数量、映射模型参数及模型集成权重参数进行优化,获得使DXN预测模型泛化性能最优的虚拟样本。
2.根据权利要求1所述的面向二噁英检测的概率密度分布驱动虚拟样本生成方法,其特征在于,所述步骤S1中,基于约简特征PDF生成虚拟样本输入,具体包括:
S101,基于PCA约简特征:
对于DXN小样本训练集Rtrain的d维输入特征进行主成分分析:首先,依据式分别对样本进行中心化处理,然后将其排列为d×Ntrain的矩阵接着,计算其协方差矩阵并进行特征值分解,特征值排序为:λ1≥λ2≥...≥λd;然后,根据设定的方差贡献率阈值θpca由式计算主成分数量d′;最后,取λ1≥λ2≥...≥λd′对应的d′个特征向量组成投影矩阵Utrain=(u1,u2,...,ud′)并由此计算降维后的样本矩阵,如下式,
其中,Xtrain为DXN训练集输入,为降维后训练集输入,每个样本均包含d′个特征,即相应地,Xtrain的d′个主成分表示为其中,
S102,基于KDE生成候选虚拟主成分:
对基于PCA特征约简后的Xtrain主成分进行核密度估计,以第i个主成分为例,计算的核密度估计为,
其中,hkde为核密度估计的平滑指数;K(·)为核函数;Ntrain为训练集Xtrain中样本数量;
选用式所示的高斯函数作为核函数,每个样本点对应的高斯分布的方差为hkde,均值为样本值则的计算为,
基于上述主成分的核密度估计结果,生成符合主成分分布的候选虚拟主成分;
S103,基于采样重构虚拟样本输入:
依据Xtrain的主成分分布估计生成的候选虚拟主成分之间相互独立,为最大程度上获得更多的组合模式,通过对各候选虚拟主成分进行随机正交采样的方式获得主成分间相互关联的虚拟主成分的生成方式为:
其中,rand表示[1,Nvpc]中随机整数;
因此,的生成方式描述为:从d′个虚拟候选主成分中各随机抽取一个组成一个d′维虚拟样本输入的主成分
对于生成的虚拟样本输入的主成分进行PCA重构以获得虚拟样本输入Xvs,计算虚拟样本输入如下式:
其中,为训练集输入Xtrain的均值向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210271839.3/1.html,转载请声明来源钻瓜专利网。