[发明专利]一种融合网络结构和文本信息的社交关系预测方法有效
申请号: | 201711143539.2 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107729569B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 张子柯;许帅帅;尤志强;周鸽;刘闯 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/04;G06Q50/00 |
代理公司: | 33201 杭州天正专利事务所有限公司 | 代理人: | 王兵;黄美娟 |
地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种融合网络结构和文本信息的社交关系预测方法,包括如下步骤:步骤1,构造原始兴趣向量;步骤2,构造修正兴趣向量;步骤3,重构用户兴趣向量;步骤4,预测社会关系。本发明综合考虑了社交网络中的文本信息和结构信息,解决了类似于微博和推特等社交网络平台上的链路预测问题和推荐问题;给出了一个可以应用在不同社交平台上的链路预测问题的统一解决框架;由于应用了word2vec,IKanalyzer等开源包,采用了兴趣向量,修正兴趣向量,桥接点等机制,所以达到了很高的预测准确度;丰富了对于链路预测方法的认识和理解。 | ||
搜索关键词: | 一种 融合 网络 结构 文本 信息 社交 关系 预测 方法 | ||
【主权项】:
1.一种融合网络结构和文本信息的社交关系预测方法,包括如下步骤:/n步骤1,构造原始兴趣向量;/n使用微博和推特数据集中的用户关注关系和用户的文本信息内容,首先使用开源分词工具Ik Analyzer对数据集中的所有文本信息,即所有用户发表的微博内容或者推文内容,进行关键词的提取;这样可以得到用来刻画每一个用户的一系列关键词;然后将分词工具得到的所有的词语使用word2vec开源工具进行聚类,设置聚类个数为N,即将这些词划分为N个类别,这样就得到了N个话题类别,那么对于每一个用户来说,现在可以得到一个维度是N的兴趣向量,该向量的具体计算方法如下:针对一个用户i,构建一个长度为N维且每一个维度取值都为0的初始兴趣向量,然后依次扫描属于用户i的所有的关键词,若某个关键词属于第j个话题类别,那么用户i的特征向量中的第j个维度的值加1;直到扫描完所有属于该用户的关键词,就可以得到该用户i的兴趣向量;在该兴趣向量中,得分越高的维度说明该用户对于该维度的话题有更多的关注度和兴趣,使用T
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711143539.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种能减少LED所需使用数量的背光模组
- 下一篇:背光模组及显示装置