[发明专利]一种翻译方法及装置、翻译模型的训练方法及装置有效

申请号：	201910198990.7	申请日：	2019-03-15
公开（公告）号：	CN109933809B	公开（公告）日：	2023-09-15
发明（设计）人：	李长亮;王怡然;郭馨泽;唐剑波	申请（专利权）人：	北京金山数字娱乐科技有限公司;成都金山互动娱乐科技有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06N3/0455;G06N3/08;G06N3/0442
代理公司：	北京智信禾专利代理有限公司 11637	代理人：	王治东;吴肖肖
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种翻译方法装置模型训练
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种翻译方法及装置、翻译模型的训练方法及装置，其中，所述方法包括：将目标文本进行拆分，得到至少两个分句；将每个分句输入至编码层，得到每个分句对应的句编码向量；根据每个分句对应的句编码向量，得到所述目标文本对应的文本编码向量；将文本编码向量输入至解码层，生成目标文本对应的翻译文本。与现有技术相比，增强了目标文本的语句依赖关系，从而使翻译模型在翻译长文本的情况下，能够获得更好的翻译效果。

技术领域

本申请涉及人工智能技术领域，特别涉及一种翻译方法及装置、翻译模型的训练方法及装置、计算设备、计算机可读存储介质以及芯片。

背景技术

现有技术中，大多数翻译模型的框架为编码层-解码层结构，其中，编码层负责将源语言语句压缩为语义空间中的一个编码向量，并将该编码向量输入至解码器，其中，该编码向量包含源语言句子的主要信息；解码层将编码层提供的编码向量进行迭代，产生在语义上等价的目标语言语句，即机器翻译结果。

现有的翻译模型在对长文本的编码过程中，往往会丧失文本的长距离的依赖关系，导致不能获得好的翻译效果，存在大量的漏翻现象。

发明内容

有鉴于此，本申请实施例提供了一种翻译方法及装置、翻译模型的训练方法及装置、计算设备、计算机可读存储介质以及芯片，以解决现有技术中存在的技术缺陷。

本申请实施例提供了一种翻译方法，用于翻译模型，所述翻译模型包括编码层和解码层，所述方法包括：

将目标文本进行拆分，得到至少两个分句；

将每个分句输入至编码层，得到每个分句对应的句编码向量；

根据每个分句对应的句编码向量，得到所述目标文本对应的文本编码向量；

将文本编码向量输入至解码层，生成目标文本对应的翻译文本。