[发明专利]以离群点为中心带权重的AP聚类算法的改进方法在审

专利信息
申请号: 201710179082.4 申请日: 2017-03-23
公开(公告)号: CN106970970A 公开(公告)日: 2017-07-21
发明(设计)人: 贺晨阳;闵圣捷;彭京;李建;赖宇;谢伯栋;姜淮韬;赵敬千;白云;杨伟华;张仕洪;石葆梅;周洋;杨春勇 申请(专利权)人: 成都市公安局;中电科华云信息技术有限公司;成都市公安科学技术研究所;四川省公安厅;四川省公安科研中心
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海汉声知识产权代理有限公司31236 代理人: 郭国中
地址: 610017 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 离群 中心 权重 ap 算法 改进 方法
【说明书】:

技术领域

发明涉及一种AP聚类算法的改方法,特别是涉及一种以离群点为中心带权重的AP聚类算法的改进方法。

背景技术

对于流式处理过程中,离群点的检测可以看成是时间序列的离群点检测,但是对于某时间范围内(t0-t1)内被检测到是离群点,由于离群点本身的带有学习能力,那么在下一个周期(t1-t2)不一定可以认为上一个周期的离群点数据还是离群点数据,但是在此周期的离群点任然是离群点。如果长时间的积累,那么我们对”老油条”式的离群点无法检测。

发明内容

本发明所要解决的技术问题是提供一种以离群点为中心带权重的AP聚类算法的改进方法,其能够增加检测率,降低遗漏的概率,提高使用效率,降低成本,使用方便。

本发明是通过下述技术方案来解决上述技术问题的:一种以离群点为中心带权重的AP聚类算法的改进方法,其包括以下步骤:

步骤一,对流式数据检测宽度的划分,是则转步骤二,否则转步骤五;

步骤二,是否对周期T内的AP聚类离群点检测,是则转步骤四,否则转步骤三;

步骤三,T+1周期内样本点权重更新;

步骤四,周期T+1内的AP聚类离群点检测;

步骤五,离群点入库;

步骤六,结束。

优选地,所述步骤一采用等距离的方式进行划分,在迭代过程中可以根据上次离群点统计情况按概率分布的形式进行划分,并初始化样本权重。

优选地,所述步骤二和步骤四都采用AP聚类计算离群点,并根据是否是离群点增加对应本周期内样本点的权重。

优选地,所述步骤三对于增加权重的样本在下一个周期内的相同样本或则相似样本进行更新权重,对于权重的更新可以采用错分样本对数比率的方式,或增强学习的积累回报期望,或则信息增益的作为权重。

优选地,所述步骤五对于所有的周期都执行完成后,离群点已经入库,这个时候我们可以采用迭代的方式继续的检测出新的离群点,最终产出最后的离群点。

本发明的积极进步效果在于:本发明能够描述了离群点的动态学习过程,而不是一层不变的孤立点;增加了离群点在下一个周期的权重,这样就增加了在下次周期被检测的概率;通过反复的迭代方式发现离群点,效果比较突出,遗漏的概率比较低。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。

如图1所示,本发明以离群点为中心带权重的AP聚类算法的改进方法包括以下步骤:

步骤一,对流式数据检测宽度的划分,是则转步骤二,否则转步骤五;

步骤二,是否对周期T内的AP(Affinity Propagation,亲和力传播)聚类离群点检测,是则转步骤四,否则转步骤三;

步骤三,T+1周期内样本点权重更新;

步骤四,周期T+1内的AP聚类离群点检测;

步骤五,离群点入库;

步骤六,结束。

所述步骤一采用等距离的方式进行划分,在迭代过程中可以根据上次离群点统计情况按概率分布的形式进行划分,并初始化样本权重。

所述步骤二和步骤四都采用AP聚类计算离群点,并根据是否是离群点增加对应本周期内样本点的权重。

所述步骤三对于增加权重的样本在下一个周期内的相同样本或则相似样本进行更新权重,对于权重的更新可以采用错分样本对数比率的方式,或增强学习的积累回报期望,或则信息增益的作为权重等等。

所述步骤五对于所有的周期都执行完成后,离群点已经入库,这个时候我们可以采用迭代的方式继续的检测出新的离群点,最终产出最后的离群点。

所述权重的计算方式采用多种方式,可以采用错分样本对数比率的方式,或增强学习的积累回报期望。或则信息增益的作为权重等等。

所述离群点在所有的时间周期内都是可能存在的,一旦发现不能在其他的周期内“逃逸”,必须对周期内的离群点进行权重加强,减少逃逸的可能性。

以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市公安局;中电科华云信息技术有限公司;成都市公安科学技术研究所;四川省公安厅;四川省公安科研中心,未经成都市公安局;中电科华云信息技术有限公司;成都市公安科学技术研究所;四川省公安厅;四川省公安科研中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710179082.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top