[发明专利]文本情感倾向的判别方法有效
申请号: | 201710812048.6 | 申请日: | 2017-09-11 |
公开(公告)号: | CN107577665B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 秦科;段贵多;刘贵松;罗光春 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35;G06K9/62 |
代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 濮云杉;杨冬 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 倾向 判别 方法 | ||
本发明涉及文本情感倾向的判别方法,包括:A.获得训练语句,并对训练语句赋予类别标签;B.对测试语句进行拆分,并根据类别标签获得拆分后的每条语句的情感倾向得分;C.根据三种特征获得每条语句的初始权重;D.以所述的每条语句为节点、每条语句之间的相似度为边构建无向图;E.根据所述的无向图构建有向图;F.根据有向图和每条语句的初始权重,利用图排序方法迭代计算每条语句的权重值;G.迭代结束后,将所述每条语句的情感倾向得分根据权重值加权求和,获得当前文本的情感倾向值,并以此判断当前文本的情感倾向性。本发明通过对语句拆分,能够有效获得整个文本的情感倾向值,非常明显的提高了文本情感判断和分类的准确度。
技术领域
本发明涉及数据挖掘和模式识别的方法,具体讲是文本情感倾向的判别方法。
背景技术
随着互联网技术的迅猛发展,人类社交早已不局限于面对面沟通和书信交流。而网络社交媒体因其蓬勃的发展态势,逐步成为当下民众不可或缺的沟通桥梁,也是自由发表意见的交流平台,极大程度上丰富了人类生活。人们通过网络社交媒体发布信息的渠道越来越简便,频率也逐渐增大,随之带来的网络文本数量也呈极速增长趋势。
网络社交媒体中很大部分都是以传播信息为主,并兼容着娱乐、教育、营销等功能。以微博为例,已经从早期的社交平台逐步转变为民众的舆论中心,上面发布着海量的评论信息,是民众对于热点事件所持态度的风向标。不仅如此,越来越多的公众人物通过微博进行营销宣传,甚至一些国家政务机关都使用微博公开或发布信息,这使得微博平台的盛行和传播力度得到了进一步扩展,从而引发文本信息的爆炸式增长。然而,这些文本信息通常都是非结构化数据,不仅内容泛滥、结构不规整、数据量庞大,往往还蕴含着民众的情感倾向。如果单纯地以人力资源对这些海量文本进行整理和分析,无疑是困难且费时的,因此迫切需要一种能够有效处理这些网络文本信息并判别其中蕴含的情感倾向性方法。
文本挖掘与自然语言处理技术密不可分,是当下的研究热点。而文本情感倾向性判别作为文本挖掘的一个分支,以从文本信息中挖掘用户对于热点事件或品牌口碑的情感倾向为目的,在日常生活场景中有着极大的研究意义。对消费者而言,文本情感倾向性判别技术能够提供其他用户对于商品的总体评价,并以此作为购买决策的依据。对企业而言,能够通过文本情感倾向判别技术获得产品在当前市场的口碑走势,从而针对性地对产品进行改善,获得更大的经济效益。作为政府的宏观调控,基于文本情感倾向判别技术能够实现对舆情的实时监控,及时发现群众对于热点事件的情绪及态度,对不利的舆情发展进行干预,为一些突发事件提前做好准备。因此,对文本情感倾向的判断是很有必要并且是有积极意义的。
发明内容
本发明提供了一种文本情感倾向的判别方法,以有效提高文本情感倾向判断的准确性。
本发明的文本情感倾向的判别方法,包括:
A.从语料库中获得训练语句,并对训练语句赋予类别标签;
B.对测试语句进行拆分,并根据训练语句的类别标签获得测试文本拆分后的每条语句的情感倾向得分;
C.根据“情感纯净度”、“关键词特性”和“语句在文本中的位置”三种特征获得所述拆分后的每条语句的初始权重。
情感关键句表达的是文本的整体情感,蕴含的情感相对单一。情感纯净度是指句子情感单一的程度,情感纯净度越高,句子的情感单一程度越高,其情感贡献度越大,作为情感关键句的可能性越大;
由于人们的语言习惯,情感关键句作为奠定文本情感基调的句子,大多使用具有概括性的词语,例如“总而言之”、“总体”等关键词。因此,关键词特性也是计算每条语句初始权重的因素之一;
由于文本往往在开头表达情感,定下情感基调,或在结尾进行总结性的评述。因此,开头语句或者结尾语句都对整个文档的情感有着举足轻重的作用。于是在计算语句的初始权重时,也需要考虑语句位置带来的影响;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710812048.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于显示信息的方法和装置
- 下一篇:一种自由定制的中文预处理方法及其系统