[发明专利]神经网络机器翻译方法、模型、电子终端以及存储介质有效
| 申请号: | 201910770197.X | 申请日: | 2019-08-20 |
| 公开(公告)号: | CN110472255B | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 王龙跃;王永;史树明;涂兆鹏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 骆苏华 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 机器翻译 方法 模型 电子 终端 以及 存储 介质 | ||
本申请提供了一种神经网络机器翻译方法、模型、电子终端以及存储介质,神经网络机器翻译模型中包括编码器、领域变换网络模型以及解码器,编码器将源端句子编码生成共享表示,并将所述共享表示输入至所述领域变换网络模型;领域变换网络模型将共享表示进行变换生成领域特定表示,并将领域特定表示输入至解码器;解码器根据领域特定表示,生成目标端句子。上述方案中在传统的神经网络机器翻译模型的基础上增加了领域变换网络模型,通过领域变换模型能够对编码器输出的共享的表示进行变换,形成领域的特定的表示,使得神经网络机器翻译模型在处理多领域的文本时有较高的性能。
技术领域
本申请涉及机器学习技术领域,更具体的说,是涉及一种神经网络机器翻译方法、模型、电子终端以及存储介质。
背景技术
MT(Machine Translation,机器翻译),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。NMT(Neural Machine Translation,神经网络机器翻译)是最新一代的,基于神经网络实现的机器翻译技术。
目前常用的NMT模型采用编码器-解码器的框架。从信息的传递角度讲,NMT模型将源端的文本进行信息的抽取,编码成一个连续的向量空间,然后利用解码器对这个载有源端句子信息的向量进行解码成目标端的文本。
在NMT模型的实际应用中,由于使用人群的多样性,往往需要NMT模型能够处理多领域(Multi-Domain)的文本,多领域的文本有些信息是各领域间共享的,有些信息是各自领域独有的。但是,目前常用的NMT模型在训练时由于忽视了多领域的文本中各自领域独有的信息,导致其在处理多领域的文本时,性能较差。
发明内容
有鉴于此,本申请提供了一种神经网络机器翻译方法、模型、电子终端以及存储介质,以在处理多领域的文本时,提高机器翻译模型的性能。
为实现上述目的,一方面,本申请提供了一种神经网络机器翻译方法,应用于神经网络机器翻译模型,所述神经网络机器翻译模型中包括编码器、领域变换网络模型以及解码器,所述方法包括:
获取待翻译的源端句子;
将所述源端句子输入至所述编码器;
所述编码器将源端句子编码生成共享表示,并将所述共享表示输入至所述领域变换网络模型;
所述领域变换网络模型将所述共享表示进行变换生成领域特定表示,并将所述领域特定表示输入至所述解码器;
所述解码器根据所述领域特定表示,生成目标端句子。
又一方面,本申请还提供了一种神经网络机器翻译模型,包括:
编码器、领域变换网络模型以及解码器;
所述编码器,用于获取待翻译的源端句子,将所述源端句子编码生成共享表示,并将所述共享表示输入至所述领域变换网络模型;
所述领域变换网络模型,用于将所述共享表示进行变换生成领域特定表示,并将所述领域特定表示输入至所述解码器;
所述解码器,用于根据所述领域特定表示,生成目标端句子。
又一方面,本申请还提供了一种电子终端,包括:
处理器和存储器;所述处理器包括编码器、领域变换网络模型以及解码器;
其中,所述处理器用于执行所述存储器中存储的程序;
所述存储器用于存储程序,所述程序至少用于:
获取待翻译的源端句子;
将所述源端句子输入至所述编码器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910770197.X/2.html,转载请声明来源钻瓜专利网。





