[发明专利]面向社交平台的用户情感影响力分析方法有效
申请号: | 201710633537.5 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107341270B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 韩东红;王嘉兴;刘俊杰;唐翔;邵维龙;杨乐;李莉莉 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06F40/279;G06Q50/00 |
代理公司: | 北京国坤专利代理事务所(普通合伙) 11491 | 代理人: | 黄耀钧 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 社交 平台 用户 情感 影响力 分析 方法 | ||
1.面向社交平台的用户情感影响力分析方法,其特征在于:所述面向社交平台的用户情感影响力分析方法包括下述四个步骤:
第一步基于社交平台的用户网络建设:
利用网络爬虫技术从X社交平台中收集公开的用户基本信息和用户已经上传的信息,把收集的信息存储在数据库中对应的表结构中,用于构建X社交平台的用户网络;
第二步基于社交平台内文本的高效特征抽取:
首先对X社交平台中的文本进行分词处理,去除其中的标点符号、停用词和URL链接,得到纯文本的单词集合,采用文本聚类的方法,将所有训练文本的单词集合映射降维成多个话题和特征词组成特征向量矩阵,得到新的特征空间;
第三步基于深度学习算法的社交平台内文本情感分类:
利用机器学习方法对X社交平台内文本进行情感分类,机器学习方法是通过设计及其学习算法找出区分类别的特征,进而对X社交平台内文本进行情感分类;
第四步通过SeInRank算法构建社交平台情感影响力计算模型:
分别基于X社交平台用户网络结构、基X社交平台用户行为和基于X社交平台文本的用户情感倾向;
第四步通过SeInRank算法构建社交平台情感影响力计算模型包括:社交平台情感影响力的度量从三方面入手,分别是基于X社交平台用户网络结构、基于X社交平台用户行为和基于X社交平台用户信息文本的用户情感倾向:
(1)影响自发度InS,针对X社交平台用户自身,用户影响力的直观体现在用户发布信息的数量和用户拥有粉丝的数量,这两方面为自身影响力被其他用户接受提供条件,其中衡量的指标是粉丝数和用户信息总数;
(2)影响参与度InP,用户的信息可以被其他用户评论和转发,能触发这些用户行为,表明此用户对其他用户存在影响力,其中衡量的指标是转发数和评论数;
(3)影响传播度InD,用户转发一条信息,则此条信息保存在用户的信息列表中,对此用户的所有粉丝可见,这样一条信息的影响被转发行为扩散出去,而影响力的传播范围体现在转发信息的用户拥有的粉丝数;
(4)影响力动能InE,综合考虑影响力自发度、影响力参与度、影响力传播度以及用户情感倾向这四个方面,计算影响力的度量参数;
SeInRank算法的计算原理,基于X社交平台用户网络结构、基于X社交平台用户行为和基于X社交平台用户信息文本的用户情感倾向这三个量化指标结合用户的信息情感倾向得到用户的影响动能,之后迭代计算用户的SeInRank值,设X社交平台用户U的粉丝集合为Ufollow,X社交平台用户U发布的具有情感倾向的信息集合为W={W1,W2,...,Wn},Wi(1≤i≤n)是W中的一个信息,转发Wi的用户集合表示为Urepost,评论Wi的用户集合表示为Ucomment,基于上述三个量化指标,设计如下计算公式:
公式4计算影响自发度,|Ufollow|表示用户U的粉丝数目,|Wall|表示用户的信息总数,用户的信息数和粉丝数作为自身属性计算用户自身影响力,
公式5计算影响传播度,表示情感用户信息Wi的传播程度,用户Uk是Urepost中任意一个用户,对Urepost中的用户粉丝数求和,用户转发信息使用户信息影响力得到传播,
公式6计算影响参与度,|Ucomment|表示情感用户信息Wi的评论数,情感信息的转发和评论体现用户对情感影响力传播的参与程度,
公式7计算用户U的正向情感的影响力动能,其中Wpos是用户U的正向情感的信息集合,|Wpos|表示正向情感信息的个数,其中参数α、β、λ、μ为影响力计算因素的权重,
公式8计算用户U的负向情感的影响力动能,其中Wneg是用户U的负向情感的信息集合,|Wneg|表示负向情感信息的个数,公式7和公式8中参数α、β、λ、μ为影响力计算因素的权重,参数的确定方法是层次分析法,
公式9计算用户U的所有粉丝用户的正向情感影响力动能的总和,
公式10计算用户的所有粉丝用户的负向情感影响力动能的总和,
公式11计算X社交平台网络中用户节点的正向情感影响力,n为X社交平台网络中的用户节点个数,SeInRank(U)为节点U的情感影响力值,用户V是用户U的粉丝,d/n为随机游走的概率,称为阻尼系数,表示用户节点随机节点到其他用户节点的概率,
公式12计算X社交平台网络中用户节点的负向情感影响力;
基于上述计算原理,这个算法是提出的X社交平台用户情感影响力计算的SeInRank算法,是X社交平台用户情感影响力排序模型,算法首先对网络关系图中每一条链接根据公式7和8计算权重值,算法将用户关系网络图G(V,E)对应成一个邻接关系表,并将关系表缓存到LinkRDD中,其中RDD中的数据元素为一个三元组(u,v,weight),并对其进行groupByKey操作获得(u,List(node,weight))数据格式,生成一个RankRDD并设置初始rank值,数据格式为(u,rank),初始的rank值为1/n,其中n为网络关系图中的节点总数,算法中LinksRDD与RankRDD进行join操作,并转换RDD映射成为(node,weight*rank),并其进行reduceByKey操作,通过公式11和12迭代计算SeInRank值,生成新的RankRDD。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710633537.5/1.html,转载请声明来源钻瓜专利网。