[发明专利]一种基于并行演化搜索的贝叶斯网络结构学习方法在审
申请号: | 201810085728.7 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108197665A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 林小光;钟坤华;孙启龙;张矩 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络结构 贝叶斯 海量数据 遗传算法 学习 并行 搜索 全局搜索能力 人工智能领域 并行化处理 分布式计算 并行计算 高效快速 搜索过程 演化算法 并行性 传统的 云计算 寻优 服务器 遗传 应用 | ||
本发明涉及一种基于并行演化搜索的贝叶斯网络结构学习方法,属于人工智能领域。该方法基于演化计算的思想,对评分搜索过程并行化处理,以实现高效贝叶斯网络结构学习。本发明通过采用Map Reduce技术将遗传演化算法与结构寻优过程相结合,以充分利用多台服务器并行计算的能力实现高效快速学习。本发明将传统的遗传算法应用到云计算,利用分布式计算方法处理海量数据的能力和遗传算法并行性和全局搜索能力,快速高效地进行海量数据中贝叶斯网络结构学习,是目前技术没有的,具有实质性的突破。
技术领域
本发明属于人工智能领域,涉及一种基于并行演化搜索的贝叶斯网络结构学习方法
背景技术
贝叶斯网络是基于概率推理的数学模型,是贝叶斯方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一。贝叶斯网络的信息表达由两部分组成,一是采用有向无环图表示条件独立性信息的贝叶斯网络结构,网络中的每个节点表示特定域中的一个变量,节点间的连接表示相互间因果关系;一是条件概率分布函数(或条件概率表)。
贝叶斯网络结构学习是在给定一个数据样本集合的前提下,寻找一个与训练样本集匹配最好的网络结构。贝叶斯网络结构学习的目的是获得特定域中每一变量间的逻辑关系,可以通过评分搜索算法获得贝叶斯网络结构,其结构寻优过程是一个NP hard问题。现有解决方案包括K2学习算法、Tan学习算法、贝叶斯度量机制、条件似然评分方法等。
基于评分搜索的贝叶斯网络结构学习算法的基本思想是从一个基本网络结构出发,使用一定的搜索算法对结构进行改变,如加边、减边、改变边的方向等,使用一定的评分函数对网络结构进行评分,评分的结果决定了该网络的保留与否。主要涉及到两个问题,一是评分函数的选取;二是搜索算法的选择。
在大数据环境下,数据维度高,样本空间大,采用通常的学习算法进行贝叶斯网络结构学习,过程处理繁琐,耗时长。而单机处理能力有限,往往不能在合理的时间内迅速得到贝叶斯网络结构,极大地限制了下一步分析和决策。
现行国内外主流贝叶斯网络结构学习方法基本上都是采用串行处理,同时贝叶斯网络结构学习是NP hard问题,因此,在大数据环境下传统贝叶斯网络结构学习过程的性能和效率都会比较低,很难在合理的时间内得到所需要的贝叶斯网络结构。
发明内容
有鉴于此,本发明的目的在于提供一种基于并行演化搜索的贝叶斯网络结构学习方法,基于演化计算的思想,对评分搜索过程并行化处理,以实现高效贝叶斯网络结构学习。本发明通过采用Map Reduce技术将遗传演化算法与结构寻优过程相结合,以充分利用多台服务器并行计算的能力实现高效快速学习。
为达到上述目的,本发明提供如下技术方案:
一种基于并行演化搜索的贝叶斯网络结构学习方法,包括以下步骤:
S1:使用马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo,MCMC)对原始样本数据进行随机采样;采用吉布斯方法对随机采样过程进行优化处理,在高维情况下使得抽样效率更高;考虑转移概率的存在,抽样数据由若干相对独立具有初步条件概率的数据子集构成;
S2:将S1产生的数据子集分别进行基因编码,得到初始种群Xj,即若干个无边图;
S3:采用贝叶斯评分方法定义评价函数,即采用后验概率最大的原则G*=arg maxP(G|D),其中,D表示数据集,G表示一个在贝叶斯网络N上的网络结构;对于任意的结点xi,如果其父节点集为πi,则这个贝叶斯网络结构的评价函数定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810085728.7/2.html,转载请声明来源钻瓜专利网。