[发明专利]一种基于多特征融合的社交群体分类方法及系统有效
| 申请号: | 201911180128.X | 申请日: | 2019-11-27 |
| 公开(公告)号: | CN110879856B | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 李扬曦;佟玲玲;井雅琪;曹亚男;任博雅;胡燕林;时磊;段东圣;刘权 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院信息工程研究所 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06F16/909;G06K9/62;G06Q50/00 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100029*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 融合 社交 群体 分类 方法 系统 | ||
本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
技术领域
本发明属于数据挖掘-分类-群体分类技术领域,涉及一种基于多特征融合的社交群体分类方法及系统。
背景技术
分类方法的目的是根据数据集的特点构造一个分类函数或分类模型(也常称作分类器),该模型能把未知类别的样本映射到给定的类别当中。通常,利用机器学习得到的分类器可以表示为分类规则形式、决策树形式或数学公式形式;利用深度学习得到的分类器则主要利用CNN、RNN等神经网络结构寻找概率最大的标签值。
目前已有的基于社交网络的群体分类方法,大多利用已有的分类模型,以社交的关系和属性等社交网络用户特性作为特征来实现。然而,在上述方法中,用户轨迹、网络行为等同样能够反映社交属性的特征往往被忽略。
虽然上述分类方法在群体分类问题中取得了一定的成绩,但是此类方法需要使用包含特定形式特征值的数据集,这导致用户轨迹、网络行为等不规则特征难以参与进分类过程中,或特征信息有一定的缺失。在群体分类问题中,这类不规则特征对分类结果具有重要的参考价值,对不规则特征的忽略可能导致分类结果的准确性降低。
发明内容
为了缓解上述问题,本发明提出一种基于多特征融合的群体分类方法及系统。该方法引入社交关系和轨迹信息,将上述特征抽样建模,并使用Node2Vec和RNN将其投影到低维空间。基于上述模型生成的特征表示,利用深度学习模型进行分类,从而提升群体分类的精度,为信息推送提供技术支持,即可以根据群体的分类结果进行信息推送,分别为不同的用户推送不同的信息。
以上的技术问题是通过下列技术方案解决的:
一种基于多特征融合的群体分类方法,所述分类过程如下:
步骤1,对给定的数据集进行混洗,划分为训练集、验证集和测试集;同时,对用户轨迹数据进行预处理,去除噪声数据,并对缺失位置信息进行插值。其中,数据集为一个用户群的社交关系及该用户群中各用户的轨迹信息。社交关系包括不同用户之间的一对一连接关系,轨迹信息包括多个时间点的位置点坐标。
步骤2,使用频繁序列挖掘算法和LSTM网络将个体的轨迹模式进行编码。
步骤3,将该用户群的社交关系建模成图网络,利用Node2vec将社交关系投影到低维空间,学习用户的嵌入表示。
步骤4,将轨迹编码和用户的嵌入表示结合,利用softmax对轨迹模式进行分类。
步骤5,将一待分类数据集的各用户轨迹编码和各用户的嵌入表示输入到训练好的分类器中,对该待分类数据集进行分类。
上述群体分类步骤如图1。
所述步骤1中,对数据进行预处理过程如下:
步骤1.1,分析轨迹数据,根据轨迹数据中轨迹点的采样间距,定义合适的时间片,并将轨迹点与时间片一一对应。
步骤1.2,将较短时间内出现频繁远距离波动的轨迹点去除。该步骤可分为以下几个部分:
步骤1.2.1,对于每个时间片,将这个时间片的数据(即轨迹点)按用户的唯一标识符分组;
步骤1.2.2,计算该时间片所有数据的中心位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院信息工程研究所,未经国家计算机网络与信息安全管理中心;中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911180128.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有改良酥脆性的新颖糖果
- 下一篇:全自动液压榨油机液压控制系统及控制方法





