[发明专利]机器翻译模型构建方法、装置以及设备在审
| 申请号: | 202011605010.X | 申请日: | 2020-12-30 |
| 公开(公告)号: | CN112733552A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 宋锐 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F40/56 | 分类号: | G06F40/56 |
| 代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器翻译 模型 构建 方法 装置 以及 设备 | ||
本发明公开了一种机器翻译模型构建方法、装置以及设备,本发明从机器翻译模型训练维度,对目标翻译模型的构建提出改进,具体是通过对多个不同结构参数的待定翻译模型进行训练,并记录当前最优的各待定翻译模型参数,同时结合各待定翻译模型的自身训练,利用当前最优模型对各待定翻译模型进行同步融合训练,经此训练方式便可以使得不同结构参数的待定翻译模型的知识进行交互,由此构建出的目标翻译模型在显著提高翻译质量的同时,更具有较强的鲁棒性。本发明在多个翻译模型的容量、计算效率和翻译效果之间进行均衡,使多个待定翻译模型能够实现在线混合学习,从而可以兼顾机器翻译模型在实际上线时对于翻译效果以及部署操作的双重需求。
技术领域
本发明涉及机器翻译领域,尤其涉及一种机器翻译模型构建方法、装 置以及设备。
背景技术
随着全球化趋势进一步发展,语言沟通成为不同语言种族群体相互交 流面临的一个重要课题,实现任意时间、任意地点、任意语言的无障碍自 由沟通是人类追求的一个梦想。传统语言服务行业采用人工陪同口译、交 替口译以及同声传译等解决语言沟通障碍问题,但受限于人力不足以及综 合成本,无法满足普通人对不同语言沟通交流的需求。
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然 语言(目标语言)的过程,其可以大幅节约翻译时间,提高翻译效率,满 足诸如资讯等时效性要求较高或者海量文本的翻译需求,极大地降低了人 力成本。而更重要的是,它让跨语种交流变成每个人都可以拥有的能力, 语言不通不再是人们获取信息和服务的障碍。
在当前技术条件,机器翻译效果未达完全理想水平。现有的翻译模型 训练方案,主要是基于收集到的源语言和目标语言平行句对在特定模型结 构上训练至收敛得到一个翻译模型;且当模型上线时,由于受限于实际硬 件条件,通常仅能部署单个模型,甚至有些翻译模型还需要进行裁剪才能 够进行部署,现有技术尚无法在获得较佳翻译效果的同时,克服部署条件 限制过多等实际操作问题。
发明内容
鉴于上述,本发明旨在提供一种机器翻译模型构建方法、装置以及设 备,以及相应地提供了一种计算机可读存储介质和计算机程序产品,主要 解决前述机器翻译模型在部署时遇到的翻译效果不佳以及难以实操的问题。
本发明采用的技术方案如下:
第一方面,本发明提供了一种机器翻译模型构建方法,其中包括:
预先构建多个待定翻译模型,所述待定翻译模型之间具有不同的结构 和/或不同的参数;
利用预设的语料集分别对各所述待定翻译模型进行独立训练;
每训练预设的第一步数后,将各所述待定翻译模型的当前最优模型予 以保存;
每训练预设的第二步数后,对各所述待定翻译模型进行独立训练的同 时,结合所述当前最优模型以及预设的多模型混合训练策略,对各所述待 定翻译模型进行同步融合训练,其中,所述第一步数小于或等于所述第二 步数;
在进行若干轮同步融合训练并直至触发预设的训练结束条件时,得到 相应于各所述待定翻译模型的最终模型;
将至少一个所述最终模型作为目标翻译模型。
在其中至少一种可能的实现方式中,所述多模型混合训练策略包括:
每训练预设的第二步数后,将每种所述待定翻译模型经训练更新后的 当前状态作为对应该所述待定翻译模型的第一模型;
从所述当前最优模型中选择若干个第二模型,所述第二模型包括:除 任一所述第一模型对应的所述当前最优模型以外的其他所述当前最优模型;
利用所述第二模型的输出指导相应的所述第一模型的训练。
在其中至少一种可能的实现方式中,所述从所述当前最优模型中选择 若干个第二模型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011605010.X/2.html,转载请声明来源钻瓜专利网。





