[发明专利]一种中文长文本情感分析方法在审
申请号: | 201810595441.9 | 申请日: | 2018-06-11 |
公开(公告)号: | CN110096696A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 王雄;张磊;任婧;徐世中;王晟 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 唐邦英 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种中文长文本情感分析方法,所述方法包括:步骤1:文本预处理;步骤2:条件随机场抽取核心句;步骤3:对核心句进行情感分析;步骤4:定义核心句的情感极性权值;步骤5:扩展当前情感分析所使用的情感词典;步骤6:得到最终情感分析结果;采用条件随机场抽取核心句,引入句子情感极性权值来分析整篇文章,提高中文长文本情感分析的准确率。 | ||
搜索关键词: | 情感分析 长文本 情感极性 中文 抽取 文本预处理 情感词典 准确率 机场 句子 引入 分析 | ||
【主权项】:
1.一种中文长文本情感分析方法,其特征在于,所述方法包括:步骤1:文本预处理:将待情感分析的文章根据标点号进行断句,然后对断句后的每一句话进行分词、过滤停用词操作;步骤2:条件随机场抽取核心句:使用条件随机场得到整篇文章的评价对象,包含该评价对象的句子为该篇文章的核心句;步骤3:对核心句进行情感分析:采用基于情感词典的情感分析算法,分析每句话的情感极性,根据判断结果定义初始情感分数;步骤4:定义核心句的情感极性权值:采用情感极性权值来区分不同句子情感极性的强弱,根据最终的情感权值分数分析整篇文章情感极性;步骤5:扩展当前情感分析所使用的情感词典:采用点互信息率和斯坦福语义树把情感词典中未包含的情感词加入进去,扩展情感词典的使用范围;步骤6:得到最终情感分析结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810595441.9/,转载请声明来源钻瓜专利网。