[发明专利]一种利用表情符号对微博进行情感倾向分类的方法有效
申请号: | 201310664725.6 | 申请日: | 2013-12-09 |
公开(公告)号: | CN103761239B | 公开(公告)日: | 2016-10-26 |
发明(设计)人: | 刘春阳;程工;张旭;庞琳;王卿;吴俊杰;王亚琼;李红;韩小汀 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 史霞 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种根据表情符号对微博进行情感倾向分类的方法,包括:创建中性情感集、消极情感集和积极情感集;利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情贝叶斯情感分类器;利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类。本发明通过建立一个两阶段分类,即建立中性情感分类器,把中性情感的微博剔除,建立极性情感分类器,将有极性情感的微博分为积极情感和消极情感,该分类器分类速度快、占用空间小且鲁棒,且本发明能通过微博准确的了解到人们对当前的热门话题或事件的态度和网民的情绪,对社会科研和调查有着重要的帮助。 | ||
搜索关键词: | 一种 利用 表情符号 进行 情感 倾向 分类 方法 | ||
【主权项】:
一种利用表情符号对微博进行情感倾向分类的方法,其特征在于,包括:步骤一、创建中性情感集、消极情感集和积极情感集,具体为:a、选取在两年中的新浪微博中使用次数超过20万次的表情符号m个,作为种子表情符号,对选取的每个种子表情符号都抽取包含这个表情符号的微博n条作为第一微博集,每个第一微博集包含n条第一微博,从m×n条第一微博的文本中提取重现性在前100的词作为高频词,对每个种子表情符号都选取包含有这个表情符号的微博p条,作为第二微博集,每个第二微博集包含p条第二微博,观察m×p条第二微博文本内容,若一条第二微博中包含的高频词与该条第二微博的文本的情感倾向一致,则认为该条第二微博中包含的种子表情符号的情感倾向明显,并提取该条第二微博中的种子表情符号作为基准表情符号,人工将基准表情符号分类为积极情感和消极情感;b、所有积极情感的基准表情符号和所有含有积极情感的基准表情符号的第一微博组成积极情感集,所有消极情感的基准表情符号和所有含有消极情感的基准表情符号的第一微博组成消极情感集;c、定义:新闻没有情感倾向,作为中性情感的微博,选取新浪微博中的新闻用户在两年中发布的微博,作为中性情感集中的中性微博,其中,选取的中性微博的数量与消极情感集和积极情感集中的第一微博之和相等;步骤二、利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情感贝叶斯分类器;步骤三、利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类,具体为:若待测微博中含有表情符号,则提取待测微博中的表情符号为待测表情符号,将待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号对比,若待测微博中只含有与积极情感集中的基准表情符号匹配的待测表情符号或只含有与消极情感集中的基准表情符号匹配的待测表情符号,则定义该待测微博为的情感为与该待测微博中含有的表情符号的情感倾向相同的情感倾向,若待测微博中的待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号均不匹配,则利用中性情感贝叶斯感情分类器判断待测微博是否为中性微博,若待测微博为中性微博则中性情感贝叶斯感情分类器定义该待测微博为中性微博,若待测微博不是中性微博,则极性情感贝叶斯分类器将该待测微博分类,将该待测微博定义为积极情感微博或消极情感微博。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310664725.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种注射用紫杉醇纳米晶体及其制备方法
- 下一篇:制冷装置