[发明专利]一种细粒度情感分析方法有效
申请号: | 202110945239.6 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113688634B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 闫琰;周法国;张潇;李旭峰;葛逸凡;李嘉裕 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细粒度 情感 分析 方法 | ||
本发明涉及一种细粒度情感分析方法,涉及自然语言处理领域。该方法包括以下步骤:为数据集中每条样本生成序列标签和位置嵌入向量、添加“start”和“end”标志以标识样本的首尾、添加标签“pad”以补齐样本长度,之后将样本通过词典转化为整数编码序列,输入bert模型生成样本的嵌入向量;搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将样本分别输入三个模型进行训练,完成评价对象提取(OTE);搭建情感预测模型,并将样本输入该模型进行训练,完成情感极性分析(OSC);顺次连接以上训练完毕的四个模型,输入待预测样本,抽取评价对象并分析评价对象的情感极性。本发明可用于抽取评论文本中的评价对象及对其进行情感分析。
技术领域
本发明涉及自然语言处理领域,具体涉及一种细粒度情感分析方法,用于抽取评论文本中的评价对象并判断其情感极性的方法。
背景技术
细粒度情感分析,是目前自然语言处理领域中最热门的一项语义分析任务,其目的在于抽取非结构化的评论文本中的评价对象(关键词),并根据上下文得到其对应情感极性。细粒度情感分析任务的提出是因为过去粗粒度情感分析任务无法满足当下人们的需求。粗粒度情感分析任务的对象是一个文档(句子),它只能得到文档(句子)整体的情感极性倾向。但是现实世界中的事物都是多方面的,一个评论文本往往会对同一个事物的不同方面做出评价。如“这家餐厅食物很好吃,但是服务态度很差,交通也不方便。”这句评论涉及了三个评价对象且评价的极性也不同。粗粒度情感分析来分析该评论文本的时候就无法做出多方面、客观的评价,相比之下,细粒度情感分析则可以识别出“食物、”“服务态度”“交通”三个评价对象及对应情感极性。细粒度情感分析可以提取出更具体、更多元、更客观的信息,这一点具有十分广阔的应用前景和潜在价值。对于用户而言,用户可以更方便的了解自己想了解的部分,用更少的精力更高效地完成自己对商品的筛选;对于商家而言,商家可以迅速察觉自己商品不受欢迎的具体原因或是用户最喜爱的方面,这些信息有助于商家调整自己的销售策略和进行产品优化,创造更高的收益。
细粒度情感分析任务的主流方法是将任务拆解为评价对象抽取和情感极性分析两个子任务。评价对象抽取任务的常见解决方法是将抽取任务转化为序列标注任务。如Wang等人【Recursive Neural Conditional Random Fields for Aspect-basedSentiment Analysis】就利用深度学习的特征提取能力,采取循环神经网络(RecurrentNeural Network)与条件随机场(CRF)相结合的方式抽取评论文本中的评价对象和评价词。Yan等人【Graph Convolutional Networks for Target-oriented Opinion WordsExtraction with Adversarial Training】也使用了深度学习的方法,他们使用图卷积神经网络来提取深层特征,同时用对抗训练的方法提升模型的鲁棒性,并取得了不错的效果。但是上述两个模型仍然存在缺陷,Wang采用的循环神经网络提取特征的能力较弱,比如会遗忘距离过远的信息,而且其使用word2vec的词向量表达方式效果也不如现在流行的bert方法;Yan使用自定的output层为序列标注问题添加约束,从数学角度来讲效果不如条件随机场。对于情感极性分析任务而言,其核心问题在于如何使模型识别上下文和评价对象的关系。Ma【Interactive Attention Networks for Aspect-Level SentimentClassification】提出了IAN(Interactive Attention Networks)用于分别提取上下文和评价对象的隐藏态,并将该隐藏态分别添加到对方的序列上,再利用注意力机制分别提取上下文和评价对象的最终表示,用它来做最后的极性分类。Ma在论文中展现了注意力层的权重,说明了注意力机制在该任务中的可行性。
发明内容
鉴于上文所描述的问题,本发明提出了一种新方法用来解决评价对象抽取任务和评价对象情感极性分析任务,并将两者连接起来完成细粒度情感分析总任务。
根据本发明的第一方面,提供一种用于细粒度情感分析的方法,其特征在于,所述方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945239.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于追踪高空落物的视频监控系统
- 下一篇:密闭型套管