[发明专利]一种结构化仿真数据生成系统及生成方法有效

专利信息
申请号: 202211086686.1 申请日: 2022-09-07
公开(公告)号: CN115169252B 公开(公告)日: 2022-12-13
发明(设计)人: 刘川意;周宇星;韩培义;段少明 申请(专利权)人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
主分类号: G06F30/27 分类号: G06F30/27;G06N3/04;G06N3/08
代理公司: 深圳市添源创鑫知识产权代理有限公司 44855 代理人: 覃迎峰
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 结构 仿真 数据 生成 系统 方法
【权利要求书】:

1.一种结构化仿真数据生成系统,其特征在于,所述系统包括数据预处理单元以及训练和生成单元,所述数据预处理单元用于将原始数据中的每个样本转换成向量表示,并且在转换的过程中建模贝叶斯网络用以描述特征间的关联关系;所述训练和生成单元利用原始数据转换后的向量表示进行训练,得到仿真数据生成模型,利用所述仿真数据生成模型生成仿真数据记录;

其中,所述数据预处理单元包括特征离散化模块、关联关系建模模块以及特征向量转换模块,所述特征离散化模块用于将连续型特征进行离散化,输出离散化结果和连续型特征在离散化过程中的损失信息;所述关联关系建模模块利用输入的离散化结果建模一个贝叶斯网络用于描述特征间的关联关系;所述特征向量转换模块用于将所述特征离散化模块输出的离散化结果和连续型特征在离散化过程中的损失信息通过编码后进行拼接的方式转换为向量表示;

所述训练和生成单元包括生成模型训练模块、生成模型生成模块以及特征向量逆转换模块,所述生成模型训练模块用于利用原始数据的向量表示训练一个基于生成对抗网络的结构化仿真数据生成模型;所述生成模型生成模块利用训练好的仿真数据生成模型,结合所述关联关系建模模块输出的贝叶斯网络,生成保留特征间关联关系的仿真数据向量表示;所述特征向量逆转化模块用于将仿真数据向量表示转换为与原始数据结构一致的仿真数据记录;

其中,所述关联关系建模模块建模一个贝叶斯网络用于描述特征间的关联关系,具体包括:对于输入的离散化结果,利用连通的有向无环图建模特征间的关联关系结构,对于具有关联关系的特征,通过给定代表父节点特征取值的情况下代表子节点特征的条件概率来量化特征的关联关系,对于每一个特征A,根据关联关系结构获得特征A所有的父节点特征PA,计算父节点特征的所有取值情况组合,计算每一个取值情况组合下特征A所有取值的概率,记录为特征A的条件概率表,当所有特征的条件概率表都计算完毕,即获得了由表示特征间关联关系结构的有向无环图和特征条件概率表组成的贝叶斯网络。

2.根据权利要求1所述的一种结构化仿真数据生成系统,其特征在于,所述特征离散化模块用于将连续型特征进行离散化,具体包括:将连续型特征中变量取值映射到某个取值范围,使用高斯混合模型确定连续型特征所要映射的取值范围边界,将连续型特征的取值映射到对应的取值范围中。

3.根据权利要求1所述的一种结构化仿真数据生成系统,其特征在于,所述特征向量转换模块用于将所述特征离散化模块输出的离散化结果和连续型特征在离散化过程中的损失信息通过编码后进行拼接的方式转换为向量表示,具体包括:将所有特征的离散化结果进行One-Hot编码后进行拼接,即可得到特征的离散化结果的向量形式;连续型特征在离散化过程中的损失信息直接与特征的离散化结果的向量形式进行拼接,即可得到转换后的向量表示。

4.根据权利要求1所述的一种结构化仿真数据生成系统,其特征在于,所述仿真数据生成模型包括生成器和鉴别器,所述生成器的输入为噪声向量和条件向量,所述噪声向量采样自多元高斯分布,所述条件向量为所述特征离散化模块输出的离散化结果向量表示,输出为连续型特征在离散化过程中可能的损失信息,将可能的损失信息与所述条件向量拼接后得到仿真数据记录的向量表示;所述鉴别器的输入包括原始数据经过特征向量转换模块后输出的向量表示和所述生成器的输出,所述鉴别器通过鉴别结果与真实结果比对用于优化鉴别性能;所述生成器通过鉴别结果提高仿真数据的质量用于生成更接近真实数据记录分布的仿真数据记录。

5.根据权利要求4所述的一种结构化仿真数据生成系统,其特征在于,所述生成模型生成模块利用训练好的仿真数据生成模型,结合所述关联关系建模模块输出的贝叶斯网络,生成保留特征间关联关系的仿真数据向量表示,具体包括:根据贝叶斯网络中的有向无环图计算特征拓扑排序,并按照该排序依次对每个特征根据条件概率表里的概率选择离散化结果,将离散化结果转化为离散化结果向量表示后输入所述仿真数据生成模型的生成器中,所述生成器输出仿真数据向量表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211086686.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top