[发明专利]一种基于翻译匹配的跨语言属性级情感分类方法在审
申请号: | 202111529633.8 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114238636A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 吴含前;王志可;王启鹏;姚莉;李露 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/263;G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 211135 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 翻译 匹配 语言 属性 情感 分类 方法 | ||
本发明公开了一种基于翻译匹配的跨语言属性级情感分类方法,该方法能够利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能,包括领域分类和属性情感分类两部分,在模型构建过程中基于模型特征设置了模型的超参,包括多头自注意力层数量、梯度反转超参值等。领域分类利用领域判别器与语言编码器的对抗训练减小机器翻译导致真实语言与翻译语言的领域偏差问题,属性情感分类对属性序列表示和句子序列表示细粒度交互获得属性级句子表示,然后通过全连接层和softmax层获得最终情感预测结果。本发明提出的属性级情感分类模型构建代价小,并且对比试验验证结果表明,相较于其他模型,本发明提出的属性级情感分类模型结果最优。
技术领域
本发明涉及自然语言处理方法,具体涉及一种基于翻译匹配的跨语言属性级情感分类方法。
背景技术
针对粗粒度的跨语言文本分类任务研究主要分为两种方法:其一是通过双语词典和机器翻译,例如Bel等在“Cross-lingualtext categorization”中最开始使用双语词典将目标语言翻译为源语言,然后利用基于源语言的分类器对翻译文本进行分类。其二是跨语言表示学习,即通过共享特征空间进行跨语言模型迁移实现较小代价的跨语言特征对齐。在跨语言词嵌入中,不同语言中具有相似含义的词具有相似的向量表示。例如Klementiev等在“Inducing crosslingual distributed representationsof words”中用大量的并行语料训练跨语言词嵌入,并在以英语为源语言、德语为目标语言的文本分类数据集上取得了较好的效果。
对于文本的情感分类也可被视为文本分类,而早期跨语言情感分类研究通常采用词典迁移的方法,即先将源语言的情感词典迁移至目标语言,再构建目标语言基于情感词的分类器,从而达到分类的目的。但当目标语言为资源稀缺的小语种时,双语情感资源将很难获得,基于词典迁移的方法具有一定局限性,而基于机器翻译方法进行情感分析具有可行性。Banea等在“Multilingual subjectivity analysis usingmachine translation”中利用机器翻译系统对比了正向翻译与反向翻译在主观性情感分析任务上的性能,初步探索了基于机器翻译方法进行情感分析的可行性。
而属性级情感分析(Aspect-levelSentiment Analysis)则是一种细粒度的情感分类,依赖的不是整体句子,而是与特定属性相关的一组词或短语,目前跨语言属性级情感分析的研究尚处在起步阶段。Lambert等在“Aspect-levelcross-lingualsentimentclassification with constrained SMT”中提出了一种基于约束SMT的方法,该方法在考虑上下文的情况下对情感单元进行翻译,其中情感单元包含情感持有者和情感目标。实验结果证明基于该方法建立的跨语言情感分类器可以达到与单语言分类器相当的结果。而Barnes等在“Exploring distributional representations and machinetranslationforaspect-basedcross-lingualsentiment classification”中探索了基于机器翻译的方法和跨语言词嵌入表示的方法在跨语言属性级情感分类任务上的性能,该方法使用SVM作为情感分类器进行性能比较和分析。
发明内容
基于现有技术的不足,本发明提出一种基于翻译匹配的跨语言属性级情感分类方法,通过具有领域分类器、目标编码器、梯度反转层、多头自注意力层、自适应融合的基于翻译匹配的跨语言属性级情感分类模型,利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111529633.8/2.html,转载请声明来源钻瓜专利网。