[发明专利]基于稀疏子集选择算法的社区检测方法、装置及设备有效
申请号: | 201711396452.6 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108133234B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 薛璇;陈平华;孟敏;武继刚 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 子集 选择 算法 社区 检测 方法 装置 设备 | ||
本发明公开了一种基于稀疏子集选择算法的社区检测方法、装置、设备以及计算机可读存储介质,包括:根据预选的轨迹数据集,构建轨迹相似度矩阵;根据所述轨迹相似度矩阵,计算得出轨迹不相似度矩阵;利用基于不相似性的稀疏子集选择算法得到所述轨迹不相似度矩阵的稀疏子集,赋予每个稀疏子集标签,所述稀疏子集的个数为所述轨迹数据集中检测到社区个数;利用标签传播算法以及每个稀疏子集的标签为所述轨迹数据集中的每个轨迹设置标签,所述轨迹数据集中相同标签的轨迹为同一社区。利用本发明所公开的社区检测的方法、装置、设备以及计算机可读存储介质提高了社区检测的精确度和效率。
技术领域
本发明涉及复杂网络的社区挖掘技术领域,特别是涉及一种基于稀疏子集选择算法的社区检测方法、装置、设备以及计算机可读存储介质。
背景技术
随着人们在社区间的轨迹日渐增多,通过轨迹来检测社区对于社会行为分析和推荐都至关重要。为了更好的检测轨迹中可能存在的社区,对检测的精确度要求越来越高。然而,社区检测通常通过聚类来实现,轨迹聚类的目的是从移动物体的一组轨迹中识别聚类,其中特定聚类中的轨迹在一个或多个移动相关特征中显示相似性。
现有技术中通常使用稠密子图检测方法来检测社区,该方法表示一个概率聚类的顶点集合,它是标准单形空间中的单位向量,然后引入二次函数来测量它们之间的平均边缘权重,并且显性集被定义为具有最大平均边缘权重的子图,其中图中顶点表示轨迹,顶点间的权重代表轨迹间的相似度。目标是对顶点集进行迭代,每一次都能处理检测到一个具有最大平均边缘权重的子图,该子图就是所要获取的社区。然后删除已经构建子图的顶点,再次优化过程,直至顶点集为空。
稠密子图检测方法只是在每次迭代中检测出现有轨迹集中最大相关性的轨迹集,并没有考虑到迭代中轨迹集中可能存在的多个的相关性较大的轨迹集,忽略最大相关性轨迹集与其他轨迹集的关系,从而陷入局部最优。其次,在每次迭代过程中,一些与社区相关性较大的轨迹被当作为异常值处理而忽略,从而降低了社区检测的精确度。
综上所述可以看出,如何提高社区检测的精确度是目前有待解决的问题。
发明内容
本发明的目的是提供一种基于稀疏子集选择算法的社区检测方法、装置、设备以及计算机可读存储介质,已解决现有技术中社区检测精确度低的问题。
为解决上述技术问题,本发明提供一种基于稀疏子集选择算法的社区检测方法,包括:根据预选的轨迹数据集,构建轨迹相似度矩阵;根据所述轨迹相似度矩阵,计算得出轨迹不相似度矩阵;利用基于不相似性的稀疏子集选择算法得到所述轨迹不相似度矩阵的稀疏子集,以便赋予每个稀疏子集标签,所述稀疏子集的个数为所述轨迹数据集中检测到社区个数;利用标签传播算法以及每个稀疏子集的标签为所述轨迹数据集中的每个轨迹设置标签,所述轨迹数据集中相同标签的轨迹为同一社区。
优选地,所述预选的轨迹数据集X[x1,x2,...,xn]的度量包括时间,经度,纬度。
优选地,所述根据预选的轨迹数据集,构建轨迹相似度矩阵包括:
通过构建马尔科夫状态转置矩阵定义所述轨迹数据集的语义关系矩阵W1;通过全局对齐核测量所述轨迹数据集中每两个轨迹之间的空间相似度,以便于构建所述轨迹数据集的空间关系矩阵W2;通过所述语义关系矩阵W1和所述空间关系矩阵W2构建轨迹相似度矩阵W=α1W1+α2W2,其中,α1和α2为关系权重。
优选地,所述根据所述轨迹相似度矩阵,计算得出轨迹不相似度矩阵包括:根据所述轨迹相似度矩阵W,计算得出轨迹不相似度矩阵D=exp(-W)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711396452.6/2.html,转载请声明来源钻瓜专利网。