[发明专利]决策树和贝叶斯算法的突发事件分类分级方法、装置及系统在审
申请号: | 201710934709.2 | 申请日: | 2017-10-09 |
公开(公告)号: | CN107977670A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 华婷婷;孙苑;王冉;陶卫峰;游庆根;龚少麟;林宇;童号;陶骏;徐斌 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京中知法苑知识产权代理事务所(普通合伙)11226 | 代理人: | 常玉明 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策树 贝叶斯 算法 突发事件 分类 分级 方法 装置 系统 | ||
技术领域
本发明涉及智慧城市技术领域,具体涉及一种决策树算法和贝叶斯算法相结合的突发事件分类分级方法、装置及系统。
背景技术
在公共安全指挥控制领域,预案及历史方案的匹配时提高事件处置效率的关键步骤。预案及历史方案的匹配依赖于事件的分类分级。当前,国内外对突发事件分级分类通常有两种形式:一是纯人工判定,根据历史突发事件情况,人工总结出相关核心特征,形成指标体系,当新的突发事件到来时,依据指标,人工判断事件的类型和级别;二是人工+自动判定,首先通过人工总结出突发事件核心特征,形成指标体系,当新的突发事件到来时,交由机器来计算事件的类型和级别。
现有的处理突发事件分级分类的方法,都是利用传统的机器学习技术,比如贝叶斯网络、SVM支持向量机算法、模糊决策法等。然而,这些方法在在一定程度上适用范围窄,准确度比较低,不能使用现有的突发事件分类分级的需求。
发明内容
针对现有技术存在的缺陷,本发明提供了一种基于决策树算法和贝叶斯算法的突发事件分类分级方法、装置及系统,有效弥补了决策树算法对连续性的字段比较难预测,当类别太多时,错误可能就会增加和在处理特征关联性比较强的数据时表现得不太好的缺点。
本发明的一个目的是提供了一种基于决策树算法和贝叶斯算法的突发事件分类分级方法,其特征在于,包括:
S1、对预先分级分类事件库进行特征划分,构建训练样本集;
S2、根据训练样本集,分别利用ID3算法、C4.5算法、CART算法,构建三个决策树分类分级模型;
S3、根据训练样本集,构建并训练贝叶斯分类器;
S4、对待分类分级事件进行关键特征属性提取;
S5、根据事件特征属性利用三个决策树模型进行分类,得出三个分类结果;
S6、根据事件特征属性利用贝叶斯分类器对S5中的三个分类结果计算该类别的概率,取概率最高的作为最终分类结果。
其中,所述突发事件分级分类具体包括:
所述突发事件分成自然灾害、事故灾难、公共安全事件和社会安全事件四类;
所述突发事件分级性质、严重程度、可控性和影响范围四个因素分为特别重大、重大、较大和一般四个等级。
其中,所述步骤S2中利用ID3算法构建决策树模型,具体包括:
计算每个事件的每个属性的信息增益;
选择信息增益最大的特征属性作为最终的分裂点进行分支划分。
其中,所述计算待分类分级事件的每个属性的信息增益,具体包括:
计算每个事件的每个属性的期望值;
根据所述期望值计算每个属性的期望信息需求;
根据所述期望信息需求分别计算每个属性的信息增益。
其中,所述步骤S2中利用C4.5算法构建决策树分类分级模型,具体包括:
计算每个事件的每个属性的信息增益;
根据所述信息增益,计算每个属性的信息增益率;
选择信息增益率最大的特征属性作为分裂点进行分支划分。
其中,所述步骤S2中利用CART算法构建决策树分类分级模型,具体包括:
计算每个事件的每个属性的不纯度;
根据所述每个属性的不纯度,计算每个分支的GINI指数;
选取每个分支的GINI指数最小的特征属性进行分支划分,得到CART决策树模型。
其中,所述步骤S3具体包括:
基于训练样本集,根据贝叶斯定理构建贝叶斯分类分级器;
利用贝叶斯分类分级器计算各事件特征属性在各分类分级结果的条件概率,对所述贝叶斯分类分级器进行训练。
其中,所述步骤S4具体包括:
利用中文分词技术对待分类分级事件进行关键特征属性提取;。
其中,所述步骤S4具体包括:
根据样本集中事件的特征属性划分,对事件采用分词和关键字匹配,抽取待分类分级事件的关键特征属性。
本发明又一个方面,提供一种基于决策树算法和贝叶斯算法的突发事件分类分级装置,其特征在于,包括:
训练样本集构建模块,用于训练对预先分级分类事件库进行特征划分,构建训练样本集;
决策树分类分级模型构建模块,用于根据构建的训练样本集,分别利用ID3算法、C4.5算法、CART算法,构建三个决策树分类分级模型;
分类器构建模块,用于根据训练样本集,构建并训练贝叶斯分类器;
特征提取模块,用于对待分类分级事件进行关键特征属性提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710934709.2/2.html,转载请声明来源钻瓜专利网。