[发明专利]一种获取词汇情感值的方法、装置、存储介质及处理器有效
申请号: | 201811564110.5 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109657045B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 赵耕弘;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 赵晓荣;王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 词汇 情感 方法 装置 存储 介质 处理器 | ||
1.一种获取词汇情感值的方法,其特征在于,包括:
获得非种子情感词在不同文本中的情感值,所述非种子情感词在所在文本中的情感值根据所述所在文本的总情感值和所述所在文本的总词数以及所述所在文本种子情感词的个数获得;所述所在文本的总情感值为根据该文本中种子情感词及其对应的情感值获得的;所述种子情感词为情感词库中已定义的情感词;所述非种子情感词为未编入所述情感词库中的词汇;
根据所述非种子情感词在不同文本中的情感值获得所述非种子情感词的情感平均值;
将所述情感平均值作为所述非种子情感词的情感值。
2.根据权利要求1所述的方法,其特征在于,还包括:根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词。
3.根据权利要求2所述的方法,其特征在于,所述根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词,具体包括:
分别获得情感词库中正向种子情感词对应的情感值的正向平均值和负向种子情感词对应的情感值的负向平均值;
当所述非种子情感词的情感值大于或等于所述正向平均值时,确定所述非种子情感词属于正向情感词;当所述非种子情感词的情感值小于或等于所述负向平均值时,确定所述非种子情感词属于负向情感词;当所述非种子情感词的情感值大于所述负向平均值且小于所述正向平均值时,确定所述非种子情感词不属于情感词。
4.根据权利要求2所述的方法,其特征在于,所述根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词,具体包括:
当所述情感平均值为正数时,确定所述非种子情感词属于正向情感词;当所述情感平均值为负数时,确定所述非种子情感词属于负向情感词;当所述情感平均值为0时,确定所述非种子情感词不属于情感词。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述非种子情感词在所在文本中的情感值为:所述所在文本的总情感值除以所述所在文本中所述非种子情感词的个数的商,所述所在文本中所述非种子情感词的个数为所述所在文本的总词数与所述所在文本种子情感词的个数之差。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述所在文本的总情感值为所述所在文本所有种子情感词的情感值与对应修饰副词的修饰系数的乘积的累加和。
7.一种获取词汇情感值的装置,其特征在于,包括:
情感值预获取模块,用于获得非种子情感词在不同文本中的情感值,所述非种子情感词在所在文本中的情感值根据所述所在文本的总情感值和所述所在文本的总词数以及所述所在文本种子情感词的个数获得;所述所在文本的总情感值为根据该文本中种子情感词及其对应的情感值获得的;所述种子情感词为情感词库中已定义的情感词;所述非种子情感词为未编入所述情感词库中的词汇;
情感平均值计算模块,用于根据所述非种子情感词在不同文本中的情感值获得所述非种子情感词的情感平均值;
情感值确定模块,用于将所述情感平均值作为所述非种子情感词的情感值。
8.根据权利要求7所述的装置,其特征在于,还包括:
情感词判断模块,用于根据所述非种子情感词的情感值判断所述非种子情感词是否属于情感词。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当该计算机程序被处理器执行时,实现如权利要求1-6任意一项所述的获取词汇情感值的方法。
10.一种获取词汇情感值的设备,其特征在于,包括:存储器和处理器;
所述存储器存储有程序;
所述处理器用于运行所述程序,所述程序运行时执行权利要求1-6任一项所述的获取词汇情感值的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811564110.5/1.html,转载请声明来源钻瓜专利网。