[发明专利]机器翻译模型构建方法、装置以及设备在审

申请号：	202011605010.X	申请日：	2020-12-30
公开（公告）号：	CN112733552A	公开（公告）日：	2021-04-30
发明（设计）人：	宋锐	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G06F40/56	分类号：	G06F40/56
代理公司：	北京维澳专利代理有限公司 11252	代理人：	常小溪;王立民
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	机器翻译模型构建方法装置以及设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种机器翻译模型构建方法、装置以及设备，本发明从机器翻译模型训练维度，对目标翻译模型的构建提出改进，具体是通过对多个不同结构参数的待定翻译模型进行训练，并记录当前最优的各待定翻译模型参数，同时结合各待定翻译模型的自身训练，利用当前最优模型对各待定翻译模型进行同步融合训练，经此训练方式便可以使得不同结构参数的待定翻译模型的知识进行交互，由此构建出的目标翻译模型在显著提高翻译质量的同时，更具有较强的鲁棒性。本发明在多个翻译模型的容量、计算效率和翻译效果之间进行均衡，使多个待定翻译模型能够实现在线混合学习，从而可以兼顾机器翻译模型在实际上线时对于翻译效果以及部署操作的双重需求。

技术领域

本发明涉及机器翻译领域，尤其涉及一种机器翻译模型构建方法、装置以及设备。

背景技术

随着全球化趋势进一步发展，语言沟通成为不同语言种族群体相互交流面临的一个重要课题，实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。传统语言服务行业采用人工陪同口译、交替口译以及同声传译等解决语言沟通障碍问题，但受限于人力不足以及综合成本，无法满足普通人对不同语言沟通交流的需求。

机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程，其可以大幅节约翻译时间，提高翻译效率，满足诸如资讯等时效性要求较高或者海量文本的翻译需求，极大地降低了人力成本。而更重要的是，它让跨语种交流变成每个人都可以拥有的能力，语言不通不再是人们获取信息和服务的障碍。

在当前技术条件，机器翻译效果未达完全理想水平。现有的翻译模型训练方案，主要是基于收集到的源语言和目标语言平行句对在特定模型结构上训练至收敛得到一个翻译模型；且当模型上线时，由于受限于实际硬件条件，通常仅能部署单个模型，甚至有些翻译模型还需要进行裁剪才能够进行部署，现有技术尚无法在获得较佳翻译效果的同时，克服部署条件限制过多等实际操作问题。

发明内容

鉴于上述，本发明旨在提供一种机器翻译模型构建方法、装置以及设备，以及相应地提供了一种计算机可读存储介质和计算机程序产品，主要解决前述机器翻译模型在部署时遇到的翻译效果不佳以及难以实操的问题。

本发明采用的技术方案如下：

第一方面，本发明提供了一种机器翻译模型构建方法，其中包括：

预先构建多个待定翻译模型，所述待定翻译模型之间具有不同的结构和/或不同的参数；

利用预设的语料集分别对各所述待定翻译模型进行独立训练；

每训练预设的第一步数后，将各所述待定翻译模型的当前最优模型予以保存；

每训练预设的第二步数后，对各所述待定翻译模型进行独立训练的同时，结合所述当前最优模型以及预设的多模型混合训练策略，对各所述待定翻译模型进行同步融合训练，其中，所述第一步数小于或等于所述第二步数；

在进行若干轮同步融合训练并直至触发预设的训练结束条件时，得到相应于各所述待定翻译模型的最终模型；

将至少一个所述最终模型作为目标翻译模型。

在其中至少一种可能的实现方式中，所述多模型混合训练策略包括：

每训练预设的第二步数后，将每种所述待定翻译模型经训练更新后的当前状态作为对应该所述待定翻译模型的第一模型；