[发明专利]一种基于独立成分分析和核密度估计的虚拟样本生成方法在审
| 申请号: | 201910357339.X | 申请日: | 2019-04-29 |
| 公开(公告)号: | CN110097116A | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 董小社;袁坤;王龙翔;张兴军;王强;王宇菲 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于独立成分分析和核密度估计的虚拟样本生成方法,本发明在系统运行初期,训练样本数量不足的情况下,利用核密度估计的方法,通过少量样本的概率密度函数估计样本整体的概率密度函数,当原始样本各属性之间存在相关性时先采用独立成分分析的方法去除原始样本各属性之间的相关性,再进行核密度估计,根据估计得到的概率密度函数生成虚拟样本。本发明可以缓解训练机器学习模型时训练样本不足的问题,提高机器学习模型的准确度。相较于其他虚拟样本生成方法,本发明引入了独立成分分析方法解决了样本各个属性间具有相关性的问题,从而拓宽了本发明的应用面。 | ||
| 搜索关键词: | 独立成分分析 核密度估计 虚拟样本 样本 概率密度函数 训练样本 原始样本 概率密度函数估计 机器学习模型 系统运行 训练机器 准确度 应用面 去除 引入 缓解 学习 | ||
【主权项】:
1.一种基于独立成分分析和核密度估计的虚拟样本生成方法,其特征在于,包括以下步骤:步骤一,对原始样本数据进行独立成分分析,去除属性间的相关性,并判断分析结构是否收敛;步骤二,若收敛,则对独立样本采用多核密度估计法估计概率密度函数,并取样;若不收敛,则对原始样本采用多核密度估计法估计概率密度函数,并取样;步骤三,采用步骤一中独立成分分析的结果对步骤二中收敛取样的数据进行恢复相关性,使收敛取样后的数据映射回原始样本空间,得到虚拟样本;步骤四,将虚拟样本与原始样本进行混合,得到最终扩充的样本集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910357339.X/,转载请声明来源钻瓜专利网。





