[发明专利]观点角色标注方法、装置、计算机设备和介质在审
申请号: | 202010339904.2 | 申请日: | 2020-04-26 |
公开(公告)号: | CN113553855A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 章波;张月;王睿 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F40/216;G06N3/04 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 李镇江 |
地址: | 英属开曼群岛大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点 角色 标注 方法 装置 计算机 设备 介质 | ||
本公开提供了一种观点角色标注方法、装置、计算机设备和介质。该方法包括:将待标注语料输入句法模型;将所述句法模型在获得所述待标注语料的句法结构的过程中得到的隐藏状态词序列表示,与所述待标注语料一起输入串联的双向长短期记忆模型和条件随机场模型,得到待标注语料的观点角色。本公开提供了一种不采用SRL辅助的方式,却也能够达到与采用SRL辅助的方式同样的性能的观点角色标注。
技术领域
本公开涉及大数据领域,更具体而言,涉及一种观点角色标注方法、装置、计算机设备和介质。
背景技术
在大数据领域,意见挖掘和情绪分析有广泛的实际应用,如社交媒体监控和一般电子商务应用。特别是,对意见和情绪的细粒度分析是理解政治家的立场,客户评论,营销趋势和其他主观信息的关键。观点角色标注(ORL)是细粒度的情感分析的一种形式,广泛用于大数据的挖掘中。
ORL即,针对待标注的评论句子或段落、文章等,自动标注出意见持有者(即谁在评论)、意见措辞(如何评论的)、意见目标(针对什么评论的)。标注后,标注的内容可以被后续的语义分析模型等进行进一步的分析,产生各种决策,例如,将网络的资源进行与用户意见匹配的投放等。
现有技术中,为了提高ORL的性能,一般使用语义角色标注(SRL)模型帮助实现ORL。即,将待标注语料一方面输入ORL,另一方面输入SRL,而SRL在产生语义角色标注过程中的一些语义信息可以回引到ORL模型中,帮助实现更精确的标注。如果不考虑词之间的语义的话,纯粹由ORL标注出的观点角色会由于缺少了语义分析而不准确。因此,利用SRL中产生的一些语义信息,能够大大提升ORL的性能。
公开内容
有鉴于此,本公开旨在提供一种不采用SRL辅助的方式,却也能够达到与采用SRL辅助的方式同样的性能的观点角色标注。
为了达到这个目的,根据本公开的一个方面,提供了一种观点角色标注方法,包括:
将待标注语料输入句法模型;
将所述句法模型在获得所述待标注语料的句法结构的过程中得到的隐藏状态词序列表示,与所述待标注语料一起输入串联的双向长短期记忆模型(Bi-LSTM)和条件随机场模型(CRF),得到待标注语料的观点角色。
可选地,所述句法模型包括串联的Bi-LSTM编码层、打分层、解码层,所述Bi-LSTM编码层为所述待标注语料生成考虑语料前后词的语义联系的词序列表示,所述打分层根据所述词序列表示产生所述待标注语料中的各词的依存概率的概率矩阵,所述解码层根据所述概率矩阵产生句法树;所述句法模型在获得所述待标注语料的句法结构的过程中得到的隐藏状态词序列表示由所述Bi-LSTM编码层输出。
可选地,所述将所述句法模型在获得所述待标注语料的句法结构的过程中得到的隐藏状态词序列表示,与所述待标注语料一起输入串联的Bi-LSTM和CRF,包括:
将所述隐藏状态词序列表示与所述待标注语料一起输入所述Bi-LSTM;
将所述概率矩阵与所述Bi-LSTM输出的特征序列一起输入图编码器;
将所述图编码器输出的编码结果输出到所述CRF,得到待标注语料的观点角色。
可选地,所述将所述句法模型在获得所述待标注语料的句法结构的过程中得到的隐藏状态词序列表示,与所述待标注语料一起输入串联的Bi-LSTM和CRF,包括:
将所述隐藏状态词序列表示与所述待标注语料一起输入所述Bi-LSTM;
将所述句法树与所述Bi-LSTM输出的特征序列一起输入图编码器;
将所述图编码器输出的编码结果输出到所述CRF,得到待标注语料的观点角色。
可选地,所述图编码器是图卷积网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010339904.2/2.html,转载请声明来源钻瓜专利网。