[发明专利]机器翻译方法、装置及存储介质有效
申请号: | 202010172133.2 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111310485B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 黄书剑;莫绪言;何亮;戴新宇;张建兵;陈家骏 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/211;G06F40/242 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 210023 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 装置 存储 介质 | ||
1.一种机器翻译方法,其特征在于,用于基于注意力机制的机器翻译模型中,所述机器翻译模型包括编码器、解码器和总结层,所述方法包括:
根据待翻译的源端文本序列,调用所述编码器进行编码得到编码向量;
根据所述编码向量,调用所述解码器进行解码得到中间结果;
根据所述中间结果,通过所述总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,所述翻译概率分布用于指示多个候选词各自对应的选取概率;
根据所述源端文本序列中各个词语的所述翻译概率分布,生成所述源端文本序列对应的目标译文;
其中,所述机器翻译模型为基于拷贝机制的神经机器翻译模型,所述编码器和所述解码器中采用的注意力为多头注意力,所述总结层用于将采用的注意力从所述多头注意力转化为具有多头注意力信息的所述单头注意力。
2.根据权利要求1所述的方法,其特征在于,所述根据所述中间结果,通过所述总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,包括:
将所述中间结果输入至所述总结层中,得到词典词语概率分布、生成概率和注意力概率分布,所述词典词语概率分布和所述生成概率是基于所述总结层输出的结果确定的,所述注意力概率分布是基于所述总结层的注意力层得到的结果确定的;
根据所述词典词语概率分布、所述生成概率和所述注意力概率分布,计算得到当前时刻的词语对应的所述翻译概率分布。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本集,所述训练样本集包括所述至少一组样本数据组,每组所述样本数据组包括样本文本序列和预先标注的正确译文;
对于所述至少一组样本数据组中的每组所述样本数据组,采用误差反向传播算法训练得到所述机器翻译模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对于至少一组所述样本数据组,为所述样本文本序列的指定词语添加预设标签,所述预设标签用于指示所述指定词语为待拷贝的词语。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在所述样本文本序列中加入额外词向量,所述额外词向量用于指示所述样本文本序列中的每个词语的词属性,所述词属性用于指示所述词语属于所述样本文本序列或者属于预设双语词典。
6.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
获取约束处理后的所述源端文本序列,所述约束处理为基于预设双语词典对所述源端文本序列中的指定词语进行约束翻译的处理;
根据约束处理后的所述源端文本序列,调用所述编码器中的所述词预测模型得到任务标签序列,所述任务标签序列用于指示约束处理后的所述源端文本序列中的各个词语是否属于所述预设双语词典。
7.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
获取分词模型,所述分词模型为基于至少两种分词方式进行训练得到的神经网络模型;
根据所述源端文本序列,调用所述分词模型进分词得到所述源端文本序列中的所述各个词语。
8.一种机器翻译装置,其特征在于,用于基于注意力机制的机器翻译模型中,所述机器翻译模型包括编码器、解码器和总结层,所述装置包括:
编码模块,用于根据待翻译的源端文本序列,调用所述编码器进行编码得到编码向量;
解码模块,用于根据所述编码向量,调用所述解码器进行解码得到中间结果;
中间层模块,用于根据所述中间结果,通过所述总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,所述翻译概率分布用于指示多个候选词各自对应的选取概率;
生成模块,用于根据所述源端文本序列中各个词语的所述翻译概率分布,生成所述源端文本序列对应的目标译文;
其中,所述机器翻译模型为基于拷贝机制的神经机器翻译模型,所述编码器和所述解码器中采用的注意力为多头注意力,所述总结层用于将采用的注意力从所述多头注意力转化为具有多头注意力信息的所述单头注意力。
9.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010172133.2/1.html,转载请声明来源钻瓜专利网。