[发明专利]获取评价单元、建立句法路径词典的方法、装置及系统无效
申请号: | 200910082342.1 | 申请日: | 2009-04-14 |
公开(公告)号: | CN101866336A | 公开(公告)日: | 2010-10-20 |
发明(设计)人: | 王震;张翼;陈儒;高立琦;刘桂平 | 申请(专利权)人: | 华为技术有限公司;问天(北京)信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 何文彬 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 评价 单元 建立 句法 路径 词典 方法 装置 系统 | ||
技术领域
本发明涉及计算机领域,特别涉及一种获取评价单元、建立句法路径词典的方法、装置及系统。
背景技术
情感分析(Sentiment Analysis)主要是针对主观性文本单元,例如篇章、句子、短语、词语等,自动获取有用的意见信息和相关知识。情感分析主要是通过获取情感句中的评价单元,来识别出情感句的褒义、中性还是贬义。其中,评价单元是极性词和目标词的搭配对,极性词(Polarity Word)是表示情感倾向性的词语,目标词(Target Word)是极性词所修饰的某种产品或事件的属性,如在音乐领域,目标词可以为“节奏”、“嗓音”等;在汽车领域,目标词可以为“方向盘”、“座椅”等。因此,评价单元是体现情感句褒贬义的一个重要元素。在实际应用中,如何获取评价单元是进行情感分析的重要组成部分。
为了获取评价单元,现有技术提供了如下两种方法:
第一种方法是使用特殊的共现模板半自动地获取评价单元。该方法定义评价单元为三元组(Subject,Attribute,Value),将评价单元的每个元素作为共现模板的槽值,通过共现模块从待分析的情感句中匹配评价单元的三个元素。例如一个共现模块:<Attribute>of<Subject>is<Value>,待分析的情感句为The picture of this camera is great,对该句子使用共现模板进行匹配来抽取三元组,分别为(this camera,the picture,great)。该方法需要构建Subject、Attribute以及Value三个词典,为每个词典手工挑选种子词语进行初始化以及挑选了8个出现频率较高的共现模板。首先,生成Attribute和Value;其次,通过人工筛选生成的Attribute和Value,将筛选过后的正确的Attribute和Value放入到各自的词典中。
第二种方法是通过研究评价单元二元组(极性词,目标词)来获取评价单元。该方法首先需要建立三个词典,第一个词典是极性词词典,第二个词典是通过手工搜集得到的目标词词典,第三个词典是通过手工创建的链接说明词典,其中,链接说明词典主要是句法关系的描述。该方法通过使用极性词词典和目标词词典,在情感句中标注其所含有的极性词和目标词,使用链接说明词典,根据每一对极性词和目标词的句法关系来判断他们是否是正确的搭配对,从而获取评价单元。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
第一种方法共现模板种类较为单一,涵盖面较窄,从而导致召回率低;选择过程需要进行人工筛选。
第二种方法容易遗漏一些类型的句法关系,从而导致召回率低;构建词典需要手工完成,并且词典的可移植性差。
发明内容
有鉴于此,本发明实施例提供了一种获取评价单元、建立句法路径词典的方法、装置及系统。所述技术方案如下:
一种获取评价单元的方法,所述方法包括:
识别情感句的极性词和目标词;
创建句法路径,其中,所述句法路径用于连接所述极性词与所述目标词;
根据句法路径词典获取所述句法路径对应的目标词,其中,所述句法路径词典用于事先存储标准句法路径;
将所述极性词与所述获取的目标词组成评价单元。
一种获取评价单元的装置,所述装置包括:
第一识别模块,用于识别情感句的极性词和目标词;
第一创建模块,用于用于创建句法路径,其中,所述句法路径用于连接所述极性词与所述目标词;
第一获取模块,用于根据句法路径词典获取所述句法路径对应的目标词,其中,所述句法路径词典用于事先存储标准句法路径;
第一组成单元,用于将所述极性词与所述获取的目标词组成评价单元。
一种建立句法路径词典的方法,所述方法包括:
识别情感句语料库的情感句的极性词和目标词;
创建所述情感句的极性词与目标词之间的句法路径,其中,所述句法路径用于连接所述极性词与所述目标词;
对所述句法路径进行泛化;
计算泛化后的所述句法路径出现的次数,将所述计算得到的次数作为所述句法路径的频率;
选取频率超过设定的阈值的所述句法路径作为标准句法路径,将所述标准句法路径组成句法路径词典。
一种建立句法路径词典的装置,所述装置包括:
第二识别模块,用于识别情感句语料库的情感句的极性词和目标词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;问天(北京)信息技术有限公司,未经华为技术有限公司;问天(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910082342.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息推送方法、装置及系统
- 下一篇:移动终端及其与计算机连接后的通信方法