[发明专利]账号主体一致性检测方法、装置及设备在审
申请号: | 201810271423.5 | 申请日: | 2018-03-29 |
公开(公告)号: | CN110324278A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 张丹;王九硕 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/27 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联账号信息 内容数据 综合相似度 一致性检测 装置及设备 互联网账号 精准营销 社交网站 同一用户 用户主体 关联性 相似度 构建 预设 画像 分析 监控 | ||
1.一种账号主体一致性检测方法,其特征在于,包括:
获取第一账号的关联账号信息和内容数据,以及第二账号的关联账号信息和内容数据;
根据第一账号的关联账号信息和内容数据,以及第二账号的关联账号信息和内容数据,计算所述第一账号和第二账号的综合相似度;
根据所述第一账号和第二账号的综合相似度和预设的相似度阈值,确定所述第一账号和第二账号是否属于同一个用户主体。
2.根据权利要求1所述的方法,其特征在于,所述根据第一账号的关联账号信息和内容数据,以及第二账号的关联账号信息和内容数据,计算所述第一账号和第二账号的综合相似度,包括:
根据所述第一账号的内容数据和所述第二账号的内容数据,计算所述第一账号和第二账号的内容相似度和文风相似度;
根据所述第一账号的关联账号信息和所述第二账号的关联账号信息,计算所述第一账号和第二账号的关联账号交叉度;
根据所述关联账号交叉度、内容相似度和文风相似度,计算所述第一账号和第二账号的综合相似度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一账号的内容数据和所述第二账号的内容数据,计算所述第一账号和第二账号的内容相似度,包括:
计算所述第一账号的内容数据对应的领域类别和情感类别,以及所述第二账号的内容数据对应的领域类别和情感类别;
根据所述第一账号的内容数据对应的领域类别与所述第二账号的内容数据对应的领域类别的一致性,以及所述第一账号的内容数据对应的情感类别与所述第二账号的内容数据对应的情感类别的一致性,计算所述第一账号和第二账号的内容相似度。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一账号的内容数据和所述第二账号的内容数据,计算所述第一账号和第二账号的文风相似度,包括:
计算所述第一账号的内容数据的文风数据和所述第二账号的内容数据的文风数据,所述文风数据包括以下至少一种:繁体字所占比例、句子长度均值、句子排比结构信息、段落排比结构信息、预设类型文本所占的比例、预设词性的词语所占的比例、各类标点符号所占的比例、句法结构类型;
根据所述第一账号的内容数据的文风数据和所述第二账号的内容数据的文风数据,计算第一账号和第二账号的文风相似度。
5.根据权利要求2所述的方法,其特征在于,所述根据所述第一账号的关联账号信息和所述第二账号的关联账号信息,计算所述第一账号和第二账号的关联账号交叉度,包括:
根据所述第一账号的关联账号信息和所述第二账号的关联账号信息,分别计算所述第一账号和第二账号对应于预设的关联方式的关联账号的数量,所述预设的关联方式包括以下至少一种:关注、被关注、相互关注;
计算所述第一账号和第二账号对应于同一所述关联方式的关联账号中重复账号的数量;
根据所述第一账号和第二账号对应于同一所述关联方式的关联账号中重复账号的数量,计算所述第一账号和第二账号的关联账号交叉度。
6.一种账号主体一致性检测装置,其特征在于,包括:
获取模块,用于获取第一账号的关联账号信息和内容数据,以及第二账号的关联账号信息和内容数据;
计算模块,用于根据第一账号的关联账号信息和内容数据,以及第二账号的关联账号信息和内容数据,计算所述第一账号和第二账号的综合相似度;
确定模块,用于根据所述第一账号和第二账号的综合相似度和预设的相似度阈值,确定所述第一账号和第二账号是否属于同一个用户主体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271423.5/1.html,转载请声明来源钻瓜专利网。