[发明专利]基于微博数据的个人性格建模方法及装置在审
申请号: | 201810015916.2 | 申请日: | 2018-01-08 |
公开(公告)号: | CN108170827A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 孙晓;张陈;丁帅;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 预设 个人性格 建模 随机性 预设时间段 支持向量机 分布统计 关键信息 情感分析 情感识别 性格特征 用户属性 统计 | ||
本发明提供了一种基于微博数据的个人性格建模方法及装置。该方法包括:获取预设时间段内第一预设数量名微博用户的第二预设条微博数据;利用支持向量机SVM对所述第二预设数量条微博数据进行情感识别,得到第三预设数量种情感;分别标记所述第三预设数量种情感的微博数据;针对所述第一预设数量名微博用户中每个用户,对所述第三预设数量种情感的微博数据进行情感分布统计,得到所述微博用户的个人性格模型。本实施例中由于获取的数量较大且具有随机性,因此代表性更广和用户属性也更准确,不会丢失关键信息。另外,对微博数据进行情感分析,并对用户的情况进行统计,能够更准确的描述用户的性格特征。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于微博数据的个人性格建模方法及装置。
背景技术
相关技术中公开了一种对个人性格建模时主要包括以下方案:
方案一,收集用户微博数据,对用户微博数据定义情感标签,然后对用户性格进行建模。方案一的建模方法中定义情感标签的方法比较直接,由于个人性格复杂多样且具有隐藏性,只看表面的情感标签无法准确获取某个用户的个人性格。即方案一所得模型无法涵盖每个用户的性格。
方案二,依照心理学的大五人格理论、传播学的使用与满足理论和行为学动机理论,将微博用户人格特质和使用动机分别划分为五个维度(外向性、开放性、尽责性、宜人性、神经质)和四个方面(人际交往、信息获取、休闲娱乐、自我表达),再采集参与问卷调查的微博用户的实际使用行为,通过对微博用户人格特质、使用动机和使用行为数据间关系的实证分析,建三者间的影响机制模型。有研究发现,外向性、宜人性和开放性对微博使用动机有显著的正向预测作用,微博行为变量与使用动机也有显著相关性,对人格特质和使用行为进行逐步回归分析,得到了五种人格特质与使用行为的回归方程,最后从总体上建立了人格特质、使用动机与使用行为间的结构方程模型。然而方案二中用户行为属性较少,像转发量、评论量、收藏量等指标由于当时的技术能力不足,没能成功获取;并且,该方法采用调查问卷的方法进行数据收集,排除了各种无效问卷和无效用户后,共有227名新浪微博用户参与了调查,总体人数依然较少,导致部分数据拟合不明显。
发明内容
本发明实施例提供了一种基于微博数据的个人性格建模方法及装置,以解决相关技术中的不足。
第一方面,本发明提供了一种基于微博数据的个人性格建模方法,所述方法包括:
获取预设时间段内第一预设数量名微博用户的第二预设条微博数据;
利用支持向量机SVM对所述第二预设数量条微博数据进行情感识别,得到第三预设数量种情感;
分别标记所述第三预设数量种情感的微博数据;
针对所述第一预设数量名微博用户中每个用户,对所述第三预设数量种情感的微博数据进行情感分布统计,得到所述微博用户的个人性格模型。
可选地,所述微博数据情况包括中性、开心、惊讶、伤心和生气。
可选地,采用多元正态分布拟合所述第三预设数量种情感的微博数据。
可选地,对所述第三预设数量种情感的微博数据进行情感分布统计,得到所述微博用户的个人性格模型之后,所述方法还包括:
利用预设公式计算所述微博用户对应的微博数据的联合概率密度值。
第二方面,本发明提供了一种基于微博数据的个人性格建模装置,所述装置包括:
微博数据获取模块,用于获取预设时间段内第一预设数量名微博用户的第二预设条微博数据;
情感识别模块,用于利用支持向量机SVM对所述第二预设数量条微博数据进行情感识别,得到第三预设数量种情感;
微博数据标记模块,用于分别标记所述第三预设数量种情感的微博数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810015916.2/2.html,转载请声明来源钻瓜专利网。