[发明专利]社交群组识别方法在审
| 申请号: | 201510920148.1 | 申请日: | 2015-12-11 |
| 公开(公告)号: | CN105589935A | 公开(公告)日: | 2016-05-18 |
| 发明(设计)人: | 董政;吴文杰;陈露;李学生 | 申请(专利权)人: | 成都陌云科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 郭霞 |
| 地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 社交 识别 方法 | ||
技术领域
本发明涉及大数据,特别涉及一种社交群组识别方法。
背景技术
随着移动互联网的发展,将生活中的社交关系迁移到了互联网上,带来了 信息交换方式的变革,而且改变了传统的人际沟通方式,对社会生活的各个领 域具有深远的意义。用户之间可以广泛地沟通、互动,通过撰写、中转、收藏 等手段对文本数据进行操作。在社交网络中,总存在部分节点连接比较紧密, 而这些节点同其他节点之间的联系则相对稀疏,由此可将这部分连接紧密的节 点归为同一个群组。群组作为一种重要的社交关系属性,无形中给舆情控制以 及网络监管带来了巨大的挑战。如果没有对群组关系进行充分识别识别,则无 法识别群组兴趣,推荐感兴趣内容,更无法及时发现危害信息,维护良好的网 络环境。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种社交群组识别方法, 包括:
统计用户节点间的会话内容和关系,基于上述统计结果来识别特定社交群 组。
优选地,所述统计用户节点间的会话内容和关系,进一步包括:
利用数据结构对会话过程进行描述;将参与会话的用户以关系连接在一 起,构建成基于单个事件的群组;最后在社交关系拓扑中采用节点衡量指标识 别强关系群组中的节点,最后以树形的层级结构将该事件存储至文件;其中所 述强关系群组具体定义为,如果已知群组α满足:对于群组α内的每个用户节点i, 均满足i与群组α内节点构成的节点数量大于该节点与群组α外节点构成的节点 数量,则群组α被称为强关系群组;
获取每个会话拓扑中包含的指向上级节点的备注信息,找到某个特定节点 的父节点,获取每条会话所维护的中转列表,记录所有中转该信息的用户以及 评论,由此发现该信息节点的子节点集;在会话树的基础上,通过用户之间的 关系,将参与会话的节点构建成关系网络;在获取社交关系时,获取共同关注 列表,利用每个节点L完成对参与事件会话用户u的关注,如果ui关注了uj, 则节点L与ui具有共同关注,即uj节点;通过这种方式得到ui是否关注了群组 内的其他节点;
提取候选用户的语义信息,在此基础上将语义信息与会话标题匹配的用户 筛选出来作为相同语义用户,再对相同语义用户进行社交关系分析,对于符合 分析结果的用户筛选出来作为新的候选用户;候选用户又分为文本相关用户和 关系相关用户;在每一次的迭代过程中关系相关用户通过语义分析产生文本相 关用户,再计算文本相关用户的会话标题关联度阈值,从而得到目标群组;
初始候选用户集合利用搜索引擎获取,具体步骤如下:获得群组特征词, 在搜索引擎中进行检索,对检索的结果进行抓取,获得发表文本内容的用户的 链接信息,通过分析上述用户的链接信息,对每个用户的社交内容进行抓取, 作为初始化候选用户;
对用户的会话文本进行分析,通过计算用户会话标题关联度来比较每个用 户与特定会话标题之间的相关程度,若存在第i次模型迭代后的关系用户集合, 为了得到第i+1次的文本相关用户集合,对关系用户集合中的每一个元素即每一 个文本相关用户,给定语义关键词,计算每个文本相关用户的会话标题关联度; 用户i的会话标题关联度等于该用户出现关键词的次数除以用户的文本总数;在 得到了文本相关用户集合之后,计算文本相关用户的不重复的会话标题关联度 值的个数,进而得到群组节点的阈值;
若计算第i次迭代后的文本相关用户有M个,其中非重复的用户有MU个;则群组节点的前N个用户表达为:
对M个文本相关用户按照会话标题关联度值降序排列,排序后的前N个 用户是有效的,即这前N个用户是群组中的一员;得到N个用户之后就可以将 他们作为群组节点加入群组节点集合。
本发明相比现有技术,具有以下优点:
本发明提出了一种社交群组识别方法,有效提高互联网社交组群的识别准 确率和时效性。
附图说明
图1是根据本发明实施例的社交群组识别方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都陌云科技有限公司,未经成都陌云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510920148.1/2.html,转载请声明来源钻瓜专利网。





