[发明专利]用于数据处理的方法、装置和介质在审
申请号: | 202110521822.4 | 申请日: | 2021-05-13 |
公开(公告)号: | CN115345313A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 王尔立;冯璐 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩;彭梦晔 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据处理 方法 装置 介质 | ||
1.一种用于数据处理的方法,包括:
基于第一目标数据集的特征与预定数据集的特征之间的相似性,获取与所述预定数据集的特征相对应的多种候选因果模型配置的相应第一性能;
基于所述相应第一性能,从所述多种候选因果模型配置中选择目标因果模型配置;以及
利用基于所述目标因果模型配置构建的因果模型对所述第一目标数据集进行处理。
2.根据权利要求1所述的方法,还包括:
获取所述第一目标数据集;
确定所述第一目标数据集的特征;
确定所述第一目标数据集的特征与一组候选预定数据集的特征的相应相似性;以及
从所述一组候选预定数据集中选择相似性最高的候选预定数据集作为所述预定数据集。
3.根据权利要求2所述的方法,其中所述特征包括以下至少一项:
所述第一目标数据集中二值数据的比例,
所述第一目标数据集中连续数据的比例,
所述第一目标数据集中定序数据的比例,
所述第一目标数据集中分类数据的比例,
所述第一目标数据集的特征维度,
所述第一目标数据集中的样本数目,
所述第一目标数据集中丢失数据的比例,
所述第一目标数据集中的目标因素值的平衡性,
从所述第一目标数据集构造的构造特征,
所述第一目标数据集的偏度,
所述第一目标数据集的峰度,
所述第一目标数据集的均值,和
所述第一目标数据集的方差。
4.根据权利要求1所述的方法,其中选择所述目标因果模型配置包括:
获取与所述预定数据集的特征相对应的所述多种候选因果模型配置的相应第二性能;以及
基于所述相应第一性能和所述相应第二性能,从所述多种候选因果模型配置中选择所述目标因果模型配置。
5.根据权利要求4所述的方法,其中基于所述相应第一性能和所述相应第二性能选择所述目标因果模型配置包括:
针对所述多种候选因果模型配置中的每种候选因果模型配置:
确定所述多种候选因果模型配置被用于构建因果模型的次数,
确定所述候选因果模型配置被用于构建因果模型的次数,以及
基于所述多种候选因果模型配置被用于构建因果模型的次数、所述候选因果模型配置被用于构建因果模型的次数、所述候选因果模型配置的第一性能和所述候选因果模型配置的第二性能,确定所述候选因果模型配置的性能指示;以及
从所述多种候选因果模型配置中选择性能指示最高的候选因果模型配置作为所述目标因果模型配置。
6.根据权利要求1所述的方法,还包括:
获取用户请求,所述用户请求指定与所述目标因素相关联的约束;以及
基于所述用户请求和所述因果模型,确定将要应用于所述第一目标数据集中的一个或多个目标的策略。
7.根据权利要求6所述的方法,还包括:
确定对所述第二目标数据集应用所述策略所得到的目标因素的改变;以及
基于所述目标因素的改变,更新与所述目标因果模型配置相对应的第一性能。
8.根据权利要求7所述的方法,其中更新与所述目标因果模型配置相对应的第一性能包括:
确定所述目标因果模型配置被用于构建所述因果模型的次数;以及
基于所述目标因素的改变和所述目标因果模型配置被用于构建所述因果模型的次数,更新与所述目标因果模型配置相对应的第一性能。
9.根据权利要求1所述的方法,其中所述目标因果模型配置包括以下至少一项:
因果模型方法,和
因果模型方法的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110521822.4/1.html,转载请声明来源钻瓜专利网。