[发明专利]一种虚拟样本生成方法在审
| 申请号: | 201510496474.4 | 申请日: | 2015-08-13 |
| 公开(公告)号: | CN105046320A | 公开(公告)日: | 2015-11-11 |
| 发明(设计)人: | 汤健;孙春来;毛克峰;贾美英;李东;李立国;胡亚男 | 申请(专利权)人: | 中国人民解放军61599部队计算所 |
| 主分类号: | G06N3/00 | 分类号: | G06N3/00 |
| 代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 刘锋;柳兴坤 |
| 地址: | 100029 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 虚拟 样本 生成 方法 | ||
1.一种虚拟样本生成方法,用于基于多个真实样本生成虚拟样本,所述方法包括:
S100、提取所述真实样本的输入向量的潜在特征,并获取潜在特征提取模型;
S200、根据所述潜在特征和对应的输出向量训练获取预测性能满足预定条件的预测模型,所述预测模型用于根据输入向量的潜在特征计算对应的输出向量;
S300、在所有可插值的真实样本对之间进行插值生成虚拟样本的备选输入向量,所述可插值的真实样本对为对应的输入向量或输入向量的相关向量中预定数量的元素相同的两个真实样本;
S400、根据所述潜在特征提取模型提取所述备选输入向量的潜在特征;
S500、根据所述预测模型和所述备选输入向量的潜在特征计算对应的备选输出向量,并保留符合虚拟样本筛选条件的备选输出向量和对应的备选输入向量以获取所述多个真实样本对应的虚拟样本集合。
2.根据权利要求1所述的虚拟样本生成方法,其特征在于,所述步骤S100包括:
以最大化输入向量和输出向量之间的协方差为目标,基于偏最小二乘算法提取所述真实样本的输入向量的潜在特征。
3.根据权利要求2所述的虚拟样本生成方法,其特征在于,所述步骤S200包括:
S210、将所述真实样本的输入向量的潜在特征及对应的输出向量作为训练数据集;
S220、通过Bootstrap算法从所述训练数据集产生多个训练子样本;
S230、基于BPNN算法根据所述多个训练子样本构建多个候选子模型;
S240、根据所述训练数据集选取对应的模型选择权重参数大于模型选择阈值的所有候选子模型构成集成模型,其中,模型选择权重参数通过对随机生成的初始权重参数以最小化预测误差为目标进行遗传算法优化获得;
S250、基于训练数据集计算集成模型中所有子模型输出向量之和的均值作为集成模型的预测输出向量,并基于所述集成模型的预测输出向量和所述训练样本的输出向量计算集成模型的预测性能;
S260、在集成模型的预测性能满足预定条件时,将所述集成模型作为所述预测模型。
4.根据权利要求1所述的虚拟样本生成方法,其特征在于,所述步骤S300包括基于下式生成虚拟样本的备选输入向量:
其中,为第l’个插值生成的备选输入向量,为第一可插值的真实样本的输入向量,为第二可插值的真实样本的输入向量,NVSG为预定的插值分段的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军61599部队计算所,未经中国人民解放军61599部队计算所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510496474.4/1.html,转载请声明来源钻瓜专利网。





