[发明专利]一种基于并行演化搜索的贝叶斯网络结构学习方法在审
申请号: | 201810085728.7 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108197665A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 林小光;钟坤华;孙启龙;张矩 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于并行演化搜索的贝叶斯网络结构学习方法,属于人工智能领域。该方法基于演化计算的思想,对评分搜索过程并行化处理,以实现高效贝叶斯网络结构学习。本发明通过采用Map Reduce技术将遗传演化算法与结构寻优过程相结合,以充分利用多台服务器并行计算的能力实现高效快速学习。本发明将传统的遗传算法应用到云计算,利用分布式计算方法处理海量数据的能力和遗传算法并行性和全局搜索能力,快速高效地进行海量数据中贝叶斯网络结构学习,是目前技术没有的,具有实质性的突破。 | ||
搜索关键词: | 网络结构 贝叶斯 海量数据 遗传算法 学习 并行 搜索 全局搜索能力 人工智能领域 并行化处理 分布式计算 并行计算 高效快速 搜索过程 演化算法 并行性 传统的 云计算 寻优 服务器 遗传 应用 | ||
【主权项】:
1.一种基于并行演化搜索的贝叶斯网络结构学习方法,其特征在于:该方法包括以下步骤:S1:使用马尔可夫链蒙特卡罗方法(MarkovChainMonteCarlo,MCMC)对原始样本数据进行随机采样;采用吉布斯方法对随机采样过程进行优化处理,在高维情况下使得抽样效率更高;考虑转移概率的存在,抽样数据由若干相对独立具有初步条件概率的数据子集构成;S2:将S1产生的数据子集分别进行基因编码,得到初始种群Xj,即若干个无边图;S3:采用贝叶斯评分方法定义评价函数,即采用后验概率最大的原则G*=argmaxP(G|D),其中,D表示数据集,G表示一个在贝叶斯网络N上的网络结构;N={X1,X2,…,Xn},其中Xi的取值范围为
对于任意的结点xi,如果其父节点集为πi,则这个贝叶斯网络结构的评价函数定义为:
i表示待评价贝叶斯网络中结点序号;j表示结点xi不同的父节点集序号;qi为πi的实例;Nijk为数据集D中变量Xi的值取xik时,其父节点Πxi取值为第πij个时的个数,wij表示第j个,
S4:采用爬山搜索法定义进化过程;在进化操作过程中,从初始种群逐个对变量进行考察,确定每个节点的父节点,生成由父节点指向子节点的有向边;对于Xj,已经得到的父节点集合为πj;定义μ为变量父节点个数上限阈值,如果|πj|<μ,则Xj的父节点个数低于规定的上限,考查排在Xj且不在πj中的变量,从中选出这样的Xi,使得新家族评分最大;然后再比较Vnew和Vold,如果Vnew>Vold,那么将Xi添加到πj中;S5:定义进化停止条件;如果|πj|≥μ,停止进化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810085728.7/,转载请声明来源钻瓜专利网。