[发明专利]基于本体模型和多核支持向量机的情感原因抽取方法在审
申请号: | 201811303734.1 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109670045A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 谢英杰;孙越恒;王文俊 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/951;G06F17/27;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多核支持向量机 支持向量机算法 抽取 语料库 构建 基础本体 模型构建 事件聚类 事件识别 文本信息 行为概念 因果关系 预测 算法 标注 融合 地域 拓展 应用 发现 | ||
本发明公开一种基于本体模型和多核支持向量机的情感原因抽取方法,该方法主要步骤为:首先构建情感原因语料库;然后根据ABC本体模型构建情感原因本体模型;在此模型上基于支持向量机算法对情感原因事件进行识别。本发明提出了基于情感原因本体模型,该模型以ABC本体为基础,通过融合情感原因领域中情感事件、情感原因、人、地域、行为概念与概念之间的关系对基础本体模型进行拓展。然后构建了基于情感原因标注语料库,定义了情感原因事件形式化表达,实现了基于支持向量机算法的情感原因事件识别算法。主要是在情感原因本体模型进行情感原因抽取,发现文本信息中的因果关系,此方法在事件的预测、事件聚类和股市的预测中有广泛的应用价值。
技术领域
本发明属于自然语言处理领域,具体涉及一种基于本体模型和多核支持向量机的情感原因抽取方法,提出了情感原因本体模型,然后在此模型上利用多核支持向量机进行情感原因抽取,从而实现挖掘文本信息中激发情感产生和转移的触发事件。
背景技术
随着社交网络平台的快速增长,越来越多的人倾向于在社交网络上表达他们的情感,目前文本情感计算的相关研究主要包括情绪分析、情绪原因识别、情绪预测等,其中文本情感分析的研究起步最早,研究最多,情感原因抽取的研究起步较晚。但是抽取情感原因对情监控具有深远的意义,例如,面对突发事件,想知道民众的情感和产生情感的原因,依次为根据进而了解舆情走向;电影制作商想知道观影人的情感及其情感原因,从而制造出观影人更喜欢的电影。本部分主要是介绍情感原因挖掘的研究现状。
SophiaM.Y.Lee[1]第一次提出情感原因挖掘这个概念,即触发情绪产生的事件,具体表现为发生的某种状况、出现的某种情形或具体对象,可以是瞬时的,也可以是持续性的。相关的研究方案也是由语言学规则进行驱动,针对新闻文本中的情绪表达抽取其对应的原因。随着研究的深入,开始出现一些基于机器学习模型的方法,把情感原因抽取的问题转化为原因候选的分类问题。Chen[2]等提出了一种多标签方法来实现情绪原因的探测,这种方法不仅可以发现跨子句的原因,还能提供有用的长距离的原因信息。Gui[3]等首次尝试挖掘微博文本中情绪原因信息,分别采用了基于规则的方法和基于机器学习的方法。
参考文献:
[1]Sophia Yat Mei Lee,YingChen,and Chu-Ren Huang.2010.A text-drivenrule-based system for emotioncause detection.In Coling 2010,Beijing,China.
[2]Chen Y,Lee S Y M,Li S,et al.Emotion Cause Detection withLinguistic Constructions[C]//Proceedings of the 23rd International Conferenceon Computational Linguistics,Beijing,2010:179-187.
[3]Lin Gui,Dongyin Wu,YuZhou,Qin Lu and RuifengXu.2016.Event-DrivenEmotion Cause Extraction withCorpus Construction,in Proceedings of EmpiricalMethods for Natural LanguageProcessing(EMNLP),pp.1639-1649.
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于本体模型和多核支持向量机的情感原因抽取方法。
本发明为解决背景技术中提出的技术问题,所采用的技术方案如下:基于本体模型和多核支持向量机的情感原因抽取方法,该方法主要步骤为:首先构建情感原因语料库,然后根据ABC本体模型构建情感原因本体模型,最后在此模型上基于支持向量机算法对情感原因事件进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811303734.1/2.html,转载请声明来源钻瓜专利网。