[发明专利]一种基于独立成分分析和核密度估计的虚拟样本生成方法在审
| 申请号: | 201910357339.X | 申请日: | 2019-04-29 |
| 公开(公告)号: | CN110097116A | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 董小社;袁坤;王龙翔;张兴军;王强;王宇菲 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 独立成分分析 核密度估计 虚拟样本 样本 概率密度函数 训练样本 原始样本 概率密度函数估计 机器学习模型 系统运行 训练机器 准确度 应用面 去除 引入 缓解 学习 | ||
1.一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,包括以下步骤:
步骤一,对原始样本数据进行独立成分分析,去除属性间的相关性,并判断分析结构是否收敛;
步骤二,若收敛,则对独立样本采用多核密度估计法估计概率密度函数,并取样;若不收敛,则对原始样本采用多核密度估计法估计概率密度函数,并取样;
步骤三,采用步骤一中独立成分分析的结果对步骤二中收敛取样的数据进行恢复相关性,使收敛取样后的数据映射回原始样本空间,得到虚拟样本;
步骤四,将虚拟样本与原始样本进行混合,得到最终扩充的样本集。
2.根据权利要求1所述的一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,当样本数据各个属性间存在相关性时,独立成分分析所得到的结果如下:
假设收集到少量样本为,
x=(x1,x2,…,xn),x∈Rn
假设x是由n个相互独立的随机变量s经过线性变换后所得到的,则有,
s=(s1,s2,…,sn),s∈Rn
假设A为混合矩阵则有,
x(i)=As(i),i=(1,2,…,m);
其中,x为已收集到的样本,s为经过独立成份分析后得到的独立随机变量,A为常量。
3.根据权利要求1所述的一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,采用多核密度估计法估计概率密度函数的方法如下:
核密度估计的数学表达式为,
根据均平方积分误差函数求解光滑系数h,其中f(s)为s的真实概率密度函数,为对f(s)的估计;
求解出光滑系数h之后,就完成了对s概率密度函数的估计。
4.根据权利要求3所述的一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,采用高斯函数作为核函数,高斯函数表达式为,
5.根据权利要求1所述的一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,步骤二中,取样的方法如下:
sv=si+hsr,where1≤i≤n,sr~N(0,1)
其中,sv为取样值。
6.根据权利要求1所述的一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,原始样本数据为训练样本数量不足的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910357339.X/1.html,转载请声明来源钻瓜专利网。





