[发明专利]一种基于微博的网络用户增强表示方法有效
申请号: | 201710283853.4 | 申请日: | 2017-04-26 |
公开(公告)号: | CN107122455B | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 胡玥;贾焰;周斌;杨树强;韩伟红;李爱平;黄九鸣;江荣;全拥;邓璐;刘强;张涛;童咏之;刘心;韩文祥 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q50/00 |
代理公司: | 43202 国防科技大学专利服务中心 | 代理人: | 文玲 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于微博的网络增强表示方法,本发明属于微博数据挖掘领域,尤其涉及针对微博数据的网络表示学习方法。该方法考虑微博短文本的口语化特征,有针对性地进行文本的预处理,从而降低噪声数据的影响;采用LDA主题模型生成用户历史博文文本的特征表示,并计算任意两用户博文特征间的余弦相似度,从而构建潜在好友关系网络;整合原始网络的结构信息,并将潜在好友关系融合到原始网络中,得到修正后的网络结构。本发明利用从用户生成文本中提取到的潜在好友关系网络,修正原始的网络拓扑结构,从而得到更准确的微博用户节点的特征表示。相比于只考虑网络结构的网络表示学习方法,在性别和年龄推理两个任务上,准确率得到明显的提高。 | ||
搜索关键词: | 一种 基于 网络 用户 增强 表示 方法 | ||
【主权项】:
1.一种基于微博的网络用户增强表示方法,其特征在于,包括以下步骤:/n步骤一、结合现有的微博短文本处理方法,对用户生成博文进行预处理,从而消除噪声数据的影响;/n步骤二、参照相关自然语言处理技术,生成预处理后的用户博文文本的特征向量,参照相似度度量函数计算博文向量之间的相似度,基于用户生成文本的潜在好友关系提取,构建潜在的好友关系网络;/n步骤三、考虑网络结构的一阶和二阶相似性,整合原始网络结构信息并扩充微博中用户间的拓扑关系网络;/n步骤四、将从博文信息提取到的潜在好友关系网络融合到整合后的网络拓扑结构上,修正原始的网络结构信息,包括增加部分潜在的连边以及增大部分已有连边的权重值两种修正方式;/n步骤五、参照现有的网络表示学习技术,学习增强后的微博网络用户的特征表示;/n步骤六、为了对比增强网络的表示向量与原始网络的表示向量之间的效果差异,将上述表示学习结果应用到性别和年龄推理任务上,与基准方法对比推理结果的准确率。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710283853.4/,转载请声明来源钻瓜专利网。