[发明专利]文本翻译方法、装置、设备及计算机可读存储介质有效
申请号: | 202110287301.7 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112668347B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张祥文 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/56;G06F40/268;G06F16/35;G06N3/08;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 翻译 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种文本翻译方法,其特征在于,所述方法包括:
调用编码器对待翻译文本中的每个待翻译词依次进行映射处理,得到所述待翻译文本的隐状态表示,所述隐状态表示包括每个所述待翻译词的词向量表示;
根据所述待翻译文本的隐状态表示,预测得到候选词集合;
在调用解码器对所述隐状态表示进行解码翻译过程中,针对于每个所述待翻译词,获取在所述待翻译词之前的已翻译词对应的中间向量表示;
根据所述中间向量表示,预测所述待翻译词的未来词向量表示,其中,所述未来词向量表示与未来词对应,所述未来词是指预测得到的位于当前的待翻译词之后的其他待翻译词对应的译文词;
调用所述解码器依次基于每一所述待翻译词的词向量表示和所述未来词向量表示,在所述候选词集合中预测出与所述待翻译文本对应的译文;
所述解码器包括标准解码器和未来解码器;所述调用所述解码器依次基于每一所述待翻译词的词向量表示和所述未来词向量表示,在所述候选词集合中预测出与所述待翻译文本对应的译文,包括:调用所述标准解码器,根据所述当前的待翻译词的词向量表示和所述当前的待翻译词对应的所述中间向量表示,生成与所述当前的待翻译词对应的标准状态表示,其中,所述标准状态表示是指预设词库中具有最高概率作为所述当前的待翻译词的译文词的词的词向量表示,所述当前的待翻译词的译文词的词是基于所述当前的待翻译词的词向量表示和所述中间向量表示确定的;调用所述未来解码器,根据所述当前的待翻译词的词向量表示和所述未来词向量表示,生成与所述当前的待翻译词对应的未来状态表示,其中,所述未来状态表示是指所述预设词库中具有未来词数量的词的词向量表示,所述具有未来词数量的词是基于所述当前的待翻译词的词向量表示和所述未来词向量表示确定的;根据每个所述待翻译词的所述标准状态表示和所述未来状态表示,在所述候选词集合中生成与所述待翻译文本对应的译文。
2.根据权利要求1所述的方法,其特征在于,所述调用编码器对待翻译文本中的每个待翻译词依次进行映射处理,得到所述待翻译文本的隐状态表示,包括:
对所述待翻译文本进行分词处理,得到至少一个待翻译词;
调用所述编码器对每个所述待翻译词进行词向量映射,得到与每个待翻译词对应的词向量表示;
通过所述编码器对每个待翻译词对应的所述词向量表示依次进行向量变换处理,得到所述待翻译文本的隐状态表示。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待翻译文本的隐状态表示,预测得到候选词集合,包括:
调用全局分类器,基于所述待翻译文本的隐状态表示,采用多分类方式,确定出预设词库中的每一词作为所述待翻译词对应的候选词的概率;
按照所述概率由大到小的顺序,对所述预设词库中的词进行排序,形成词序列;
将所述词序列中的前预设数量的词,确定为所述候选词集合中的候选词。
4.根据权利要求1所述的方法,其特征在于,所述获取在所述待翻译词之前的已翻译词对应的中间向量表示,包括:
将所述待翻译文本中位于当前的待翻译词之前的全部待翻译词,确定为目标待翻译词;
获取所述解码器对所述目标待翻译词进行翻译后得到的全部已翻译词;
对所述全部已翻译词进行词向量映射,得到与每个所述已翻译词对应的词向量表示;
通过所述解码器对每个所述已翻译词对应的词向量表示依次进行向量变换处理,得到与所述全部已翻译词对应的隐状态表示;
将所述全部已翻译词对应的隐状态表示,确定为所述当前的待翻译词对应的中间向量表示。
5.根据权利要求4所述的方法,其特征在于,所述根据所述中间向量表示,预测所述待翻译词的未来词向量表示,包括:
在调用所述解码器对所述待翻译文本中的每个待翻译词进行解码翻译的过程中,调用局部分类器,根据所述当前的待翻译词对应的所述中间向量表示,预测与所述当前的待翻译词对应的未来词的所述未来词向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287301.7/1.html,转载请声明来源钻瓜专利网。