[发明专利]一种文本情感倾向分析系统在审
申请号: | 201410347686.1 | 申请日: | 2014-07-21 |
公开(公告)号: | CN104182387A | 公开(公告)日: | 2014-12-03 |
发明(设计)人: | 贾岩 | 申请(专利权)人: | 安徽华贞信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 合肥市长远专利代理事务所(普通合伙) 34119 | 代理人: | 程笃庆;黄乐瑜 |
地址: | 230000 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 情感 倾向 分析 系统 | ||
技术领域
本发明涉及信息检索技术领域,尤其涉及一种文本情感倾向分析系统。
背景技术
论坛、博客等网络交流平台的快速发展使得网上存在大量带有情感倾向性的文本。如何对大规模富含情感信息的文本快速进行倾向性分析,成为越来越引起广泛关注的研究问题。文本情感倾向性分析研究就是在这样的背景下开展起来的,它就是对整篇文本所体现出的情感进行判断,也就是对文本中的主观信息进行判断。
随着信息量的急速增加、新领域的不断涌现,人们需要在越来越多的新领域里进行倾向性分析,而在新领域里重新进行人工标注是个费时费力的事情。因此要尽量基于已经标注好的数据对新领域进行分析,这使得跨领域的倾向性分析具有重大意义。
商业竞争中,每个企业都需要知道他们自己产品的声誉或者竞争对手产品、品牌的声誉,这对他们自己的产品发展、市场和客户关系经营是非常有价值的。传统方式中,公司会为了了解这些信息作客户调查,这需要花费很多人力对用户满意度进行调查并对问卷进行分析。如果想要获得足够的调查信息的话,无论多么精心设计的对质量评估的调查都会导致高昂的费用。另外,尽管花费了大量的金钱和努力,这种调查的有效性通常是很有限的,既因为调查样本大小的限制,还因为制造有效的调查问卷表的困难,而且该种调查方式受限于人力资源等,尤其不适合中小企业。
发明内容
基于背景技术存在的问题,本发明提出了一种文本情感倾向分析系统,自动分析文本的情感倾向性,效率高,针对性强,人工成本低。
本发明提出的一种文本情感倾向分析系统,包括:样本训练模块、实体提取模块、特征提取模块、情感倾向识别模块;样本训练模块连接实体提取模块,样本训练模块和实体提取模块分别连接特征提取模块,特征提取模块连接情感倾向识别模块;其中,
样本训练模块,用于建立一个实体词典和一个或多个情感倾向词典,每一个情感倾向词典用于收纳同一类别的语料,词典构成判别模板;
实体提取模块,参照实体词典,过滤不含实体的内容,提取实体文本,作为需要判别情感倾向的对象;
特征提取模块,对照判别模板,根据情感倾向词典对实体文本进行筛选,从而提取实体文本中的特征项;
情感倾向识别模块,利用最大熵方法计算出特征项的权值,根据权值大小判别文本的情感倾向性。
优选地,样本训练模块中,每一个词典均可自动设置或手动设置。
优选地,情感倾向词典包括极性词典。
优选地,情感倾向词典包括程度词典。
优选地,情感倾向词典包括否定词典。
优选地,特征项包括:极性词和极性词的极性。
优选地,特征项包括:程度词、程度词的强度、程度词的位置。
优选地,特征项包括:否定词、否定词的位置。
优选地,特征项包括:否定词与极性词的位置关系。
优选地,特征项包括:否定词与程度词的位置关系。
本发明中可针对不同领域、不同文本建立不同的词典,从而根据词典构成的判别模板来提取特征项,可提高情感倾向性分析的针对性,也扩大了本发明的适用范围;本发明中通过最大熵方法计算特征项权重来分析情感倾向性,精确率更高;而且,本发明自动对输入的文本进行情感倾向性分析,效率高,人工成本低,适用于信息量庞大的商业情报分析系统,尤其解决了中小企业商业情报分析环节薄弱的问题。
附图说明
图1为本发明提出的一种文本情感倾向分析系统的结构图;
图2为图1所示文本情感倾向分析系统的工作流程图。
具体实施方式
参照图1,本发明提出的一种文本情感倾向分析系统,包括:样本训练模块、实体提取模块、特征提取模块、情感倾向识别模块。样本训练模块连接实体提取模块,样本训练模块和实体提取模块分别连接特征提取模块,特征提取模块连接情感倾向识别模块。
样本训练模块,用于建立一个实体词典和一个或多个情感倾向词典,每一个情感倾向词典用于收纳同一类别的语料,词典构成判别模板。各类词典的建立可根据待分析文本所属领域来设置,提高情感倾向性分析的针对性。例如本实施方式中,情感倾向词典包括极性词典、程度词典、否定词典等情感倾向相关词典。
实体提取模块,参照实体词典,过滤不含实体的内容,提取实体文本,作为需要判别情感倾向的对象,缩小需要进行情感倾向的文本范围,提高系统工作效率,降低分析成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽华贞信息科技有限公司;,未经安徽华贞信息科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410347686.1/2.html,转载请声明来源钻瓜专利网。