[发明专利]一种翻译方法及装置、翻译模型的训练方法及装置有效

申请号：	201910198990.7	申请日：	2019-03-15
公开（公告）号：	CN109933809B	公开（公告）日：	2023-09-15
发明（设计）人：	李长亮;王怡然;郭馨泽;唐剑波	申请（专利权）人：	北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06N3/0455;G06N3/08;G06N3/0442
代理公司：	北京智信禾专利代理有限公司 11637	代理人：	王治东;吴肖肖
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种翻译方法装置模型训练
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种翻译方法，其特征在于，用于翻译模型，所述翻译模型包括编码层和解码层，所述方法包括：

将目标文本进行拆分，得到至少两个分句，其中，所述目标文本包括N个分句，每个分句包括M个单词，M≥2、N≥2且M、N为正整数；

对于第1个分句，将所述分句输入至编码层，得到第1个分句对应的句编码向量；

对于除去第1个分句之外的第i个分句，执行：S102、根据输入至编码层的第i个分句的第1个单词和第i-1个分句对应的句编码向量，得到第1个单词对应的编码隐层输出；S104、根据输入至编码层的第i-1个分句对应的句编码向量、第j-1个单词对应的编码隐层输出和第i个分句的第j个单词，得到所述第j个单词对应的编码隐层输出，其中，2≤j≤M；S106、将j自增1，判断自增1后的j是否大于M，若是，则执行步骤S108，若否，继续执行步骤S104；S108、根据第i个分句的M个单词对应的编码隐层输出，得到第i个分句对应的句编码向量，其中，i为正整数且1＜i≤N；

根据每个分句对应的句编码向量，得到所述目标文本对应的文本编码向量；

将文本编码向量输入至解码层，生成目标文本对应的翻译文本。

2.如权利要求1所述的翻译方法，其特征在于，根据每个分句对应的句编码向量，得到所述目标文本对应的文本编码向量，包括：

将最后一个分句对应的句编码向量作为所述目标文本对应的文本编码向量。

3.如权利要求1所述的翻译方法，其特征在于，所述S102包括：

根据输入至编码层的第i个分句的第1个单词得到对应的单词编码向量；

根据第i个分句的第1个单词对应的单词编码向量以及输入至编码层的第i-1个分句对应的句编码向量，得到第1个单词对应的编码隐层输出。

4.如权利要求1所述的翻译方法，其特征在于，所述步骤S104包括：

根据输入至编码层的第i个分句的第j个单词得到对应的单词编码向量；

根据第i个分句的第j个单词对应的单词编码向量以及输入至解码层的第i-1个分句对应的句编码向量和第j-1个单词对应的编码隐层输出，得到第i个分句的第j个单词对应的编码隐层输出。

5.如权利要求1所述的翻译方法，其特征在于，所述步骤S108包括：

将第i个分句的M个单词对应的编码隐层输出分别乘以对应的权重系数，然后求和，得到第i个分句对应的句编码向量。