[发明专利]机器翻译方法、装置及存储介质有效
申请号: | 202010172133.2 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111310485B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 黄书剑;莫绪言;何亮;戴新宇;张建兵;陈家骏 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/211;G06F40/242 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 210023 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 装置 存储 介质 | ||
本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。所述方法包括:根据待翻译的源端文本序列,调用编码器进行编码得到编码向量;根据编码向量,调用解码器进行解码得到中间结果;根据中间结果,通过总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,翻译概率分布用于指示多个候选词各自对应的选取概率;根据源端文本序列中各个词语的翻译概率分布,生成源端文本序列对应的目标译文。本公开实施例通过在包括编码器和解码器的机器翻译模型中增加一层总结层的方式,避免了相关技术中使用对多头注意力做剪枝、得到的注意力作为拷贝的注意力的情况,在保证解码速度的同时,提高了机器翻译模型的翻译质量。
技术领域
本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。
背景技术
机器翻译(Machine Translation,MT)为通过计算机设备将一种自然语言的句子翻译成另一种自然语言的句子的翻译方式。
相关技术中,机器翻译通常采用序列到序列(Sequence to sequence,seq2seq)结构的模型,该模型由编码器(英文:encoder)和解码器(英文:decoder)组成。当该模型接收到一个文本序列时,编码器将该文本序列编码为编码向量,将编码向量输入到解码器中。该解码器从该编码向量中逐词解码出对应的译文。为了缓解一定训练不足和未登录词的影响,还可以利用预定义的双语词典在源端和目标端之前建立联系,并在该模型中引入了拷贝机制让模型学习词典中的关系。
但是上述方法中依靠注意力机制提供的软对齐方式进行拷贝,在基于注意力机制的机器翻译模型中编码器-解码器层中使用的注意力是多头的,一般使用对整个多头注意力做剪枝得到的注意力作为拷贝的注意力,导致拷贝使用的注意力和生成使用的注意力不一致,从而影响最终的翻译质量。
发明内容
有鉴于此,本公开提出了一种机器翻译方法、装置及存储介质。所述技术方案如下:
根据本公开的一方面,提供了一种机器翻译方法,用于基于注意力机制的机器翻译模型中,所述机器翻译模型包括编码器、解码器和总结层,所述方法包括:
根据待翻译的源端文本序列,调用所述编码器进行编码得到编码向量;
根据所述编码向量,调用所述解码器进行解码得到中间结果;
根据所述中间结果,通过所述总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,所述翻译概率分布用于指示多个候选词各自对应的选取概率;
根据所述源端文本序列中各个词语的所述翻译概率分布,生成所述源端文本序列对应的目标译文。
在一种可能的实现方式中,所述编码器和所述解码器中采用的注意力为多头注意力,所述总结层用于将采用的注意力从所述多头注意力转化为具有多头注意力信息的所述单头注意力。
在另一种可能的实现方式中,所述根据所述中间结果,通过所述总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,包括:
将所述中间结果输入至所述总结层中,得到词典词语概率分布、生成概率和注意力概率分布,所述词典词语概率分布和所述生成概率是基于所述总结层输出的结果确定的,所述注意力概率分布是基于所述总结层的注意力层得到的结果确定的;
根据所述词典词语概率分布、所述生成概率和所述注意力概率分布,计算得到当前时刻的词语对应的所述翻译概率分布。
在另一种可能的实现方式中,所述方法还包括:
获取训练样本集,所述训练样本集包括所述至少一组样本数据组,每组所述样本数据组包括样本文本序列和预先标注的正确译文;
对于所述至少一组样本数据组中的每组所述样本数据组,采用误差反向传播算法训练得到所述机器翻译模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010172133.2/2.html,转载请声明来源钻瓜专利网。