[发明专利]一种基于认知结构模型的文本情感类型识别方法及装置无效
申请号: | 201310363414.6 | 申请日: | 2013-08-20 |
公开(公告)号: | CN103440235A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 毛文吉;曾大军;皇甫璐雯;王磊 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 认知 结构 模型 文本 情感 类型 识别 方法 装置 | ||
1.一种基于认知结构模型的文本情感类型识别方法,其包括:
步骤1、对于输入的海量开源文本,基于通用语义词典和句法依存关系,采用统计方法自动构建不同的情感维度词典;其中,每个情感维度词典具有一个确定的情感维度值;
步骤2、对所构建的情感维度词典进行求精得到高质量的情感维度词典,求精具体包括语义、情感倾向的不一致性处理和非情感词的过滤;
步骤3、基于求精后得到的高质量的情感维度词典,结合情感认知结构模型中情感维度值与情感类型的对应关系,生成相应的情感类型。
2.如权利要求1所述的识别方法,其特征在于,步骤1中情感维度词典包括合意的情感维度词典、不合意的情感维度词典、值得称赞的情感维度词典、应受责备的情感维度词典和可能的情感维度词典。
3.如权利要求1所述的识别方法,其特征在于,步骤1具体包括:
步骤1.1、输入每种情感维度种子词,作为初始的情感维度词典输入;
步骤1.2、针对每个情感维度词典中新加入的情感维度词,基于通用语义词典,找出其同义词和反义词,并将其同义词和反义词放入相应的情感维度词典候选集中;
步骤1.3、利用句法依存关系,从输入文本中找出与所述每个情感维度词典中已有的情感维度词具有依存关系的新情感维度词,放入相应的情感维度词典候选集中;
步骤1.4、利用评分函数对所述情感维度词典候选集进行评价与过滤,选取其中评分大于阈值的候选集中的情感词,放入相应的情感维度词典中;
步骤1.5、不断重复步骤1.2-1.4,直到不再有新的情感维度词加入;
步骤1.6、利用通用语义词典中的派生以及还原关系扩充每个情感维度词典。
4.如权利要求3所述的识别方法,其特征在于,步骤1.4中的评分函数既考虑当前情感维度词典候选集中待评价的候选词与其对应的情感维度词典中的词共现的次数,也考虑与其对应的情感维度词典在所有情感维度词典中所占的情感词的比例。
5.如权利要求3所述的识别方法,其特征在于,步骤1.4中所述评分函数如下表示:
其中,k为某一情感维度值,u是已知情感维度值为k的情感维度词典中的词,v是当前待评价的候选情感词;DICk是当前生成的维度值为k的情感维度词典,|DICk|表示其元素个数;DIC是所有情感维度词典的并集,其元素个数为|DIC|;函数c(v,u)表示词v和词u在同一语句中共同出现的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310363414.6/1.html,转载请声明来源钻瓜专利网。