[发明专利]一种针对单个不确定图的频繁子图挖掘方法有效
| 申请号: | 201510283886.X | 申请日: | 2015-05-29 |
| 公开(公告)号: | CN104866588B | 公开(公告)日: | 2018-08-07 |
| 发明(设计)人: | 赵翔;陈一帆;葛斌;肖卫东 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李弘 |
| 地址: | 410003*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 单个 不确定 频繁 挖掘 方法 | ||
本发明公开了一种针对单个不确定图的频繁子图挖掘方法,包括:获取单个不确定图;根据单个不确定图枚举出单个不确定图的所有子图;在单个不确定图的所有蕴含图中指定部分蕴含图为样本图;分别计算单个不确定图的每个样本图的存在概率,以及每个子图在单个不确定图的样本图上的期望支持度;根据每个子图在单个不确定图的样本图上的期望支持度与单个不确定图的每个样本图的存在概率,判定该子图是否为频繁子图;输出所有频繁子图。本发明通过将单个不确定图划分为多个蕴含的确定图并将蕴含图视作确定图抽样计算子图的期望支持度的手段,能在单个不确定图上使用频繁子图挖掘技术,填补了本领域的技术空白。
技术领域
本发明涉及图挖掘技术,特别地,涉及一种针对单个不确定图的频繁子图挖掘方法。
背景技术
不确定性在现实应用中,无论是对内源还是外源,都是一种固有的属性。例如,在一个合作社交网络中,利用目前掌握的信息,我们未必能明确断言比尔和马修两人具有很好的合作关系,通常我们使用概率来衡量这种合作关系的可能性。假设这种关系存在的概率为p,p的值由本领域专家通过可用信息人工确定,或者由信息抽取或生成规则自动产生。在大数据时代的今天,对于管理不确定数据有更为强烈的需求,因此目前出现了各种质量不一的数据。特别地,我们专注于不确定图,尤其是图的边上具有存在概率的不确定图。不确定图模型具有广泛的应用领域,除了社会网络,不确定图模型还被应用于通信网络,无线传感器网络,蛋白质交互网络以及生物学中的调控网络等。
另一方面,频繁模式挖掘作为数据挖掘领域高度关注的主题,一直持续了近十年,相关研究也取得了长足的进展,其中频繁子图引起了特别的研究兴趣。所谓频繁子图是指从多个小确定图的集合或者单个大确定图中发现的支持度不小于用户给定阈值的子图。频繁子图再刻画确定图的数据特征、分类、聚类以及建立索引方面具有重要作用。
虽然目前对于频繁子图及其在确定图上挖掘的方法已经具有很好的理解,但在不确定图上,这一问题变得更加有趣但也更少被研究。一个不确定图时特殊的边加权图,其中每条边(u,v)上的权重是其存在的概率。最近,研究工作致力于在多个小的不确定图的图集上挖掘频繁子图。但是,该问题在单个大型不确定图中虽然同等重要,因为现实生活中的大型网络越来越多地出现了不确定性——比如,在社会网络中一个人对另一个人的影响是具有概率的;在生物网络中的蛋白质交互情况也有一定测量误差——但现有技术在本方面是一片空白。
针对现有技术中缺乏针对单个不确定图的频繁子图挖掘技术方案的问题,目前尚缺乏有效的解决方案。
发明内容
针对现有技术中缺乏针对单个不确定图的频繁子图挖掘技术方案的问题,本发明的目的在于提出一种针对单个不确定图的频繁子图挖掘方法,能允许针对单个不确定图进行频繁子图挖掘,填补了本领域的技术空白。
基于上述目的,本发明提供的技术方案如下:
根据本发明的一个方面,提供了一种针对单个不确定图的频繁子图挖掘方法,包括:
获取单个不确定图;
根据单个不确定图枚举出单个不确定图的所有子图;
在单个不确定图的所有蕴含图中指定部分蕴含图为样本图;
分别计算单个不确定图的每个样本图的存在概率,以及每个子图在单个不确定图的样本图上的期望支持度;
根据每个子图在单个不确定图的样本图上的期望支持度与单个不确定图的每个样本图的存在概率,判定该子图是否为频繁子图;
输出所有频繁子图。
其中,根据单个不确定图枚举出单个不确定图的所有子图包括:
从单个不确定图提取出多个蕴含图,每个蕴含图都是单个不确定图可能的存在方式;
分别计算每个蕴含图所包含的所有子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510283886.X/2.html,转载请声明来源钻瓜专利网。





