[发明专利]机器翻译模型构建方法、装置以及设备在审
| 申请号: | 202011605010.X | 申请日: | 2020-12-30 |
| 公开(公告)号: | CN112733552A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 宋锐 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F40/56 | 分类号: | G06F40/56 |
| 代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器翻译 模型 构建 方法 装置 以及 设备 | ||
1.一种机器翻译模型构建方法,其特征在于,包括:
预先构建多个待定翻译模型,所述待定翻译模型之间具有不同的结构和/或不同的参数;
利用预设的语料集分别对各所述待定翻译模型进行独立训练;
每训练预设的第一步数后,将各所述待定翻译模型的当前最优模型予以保存;
每训练预设的第二步数后,对各所述待定翻译模型进行独立训练的同时,结合所述当前最优模型以及预设的多模型混合训练策略,对各所述待定翻译模型进行同步融合训练,其中,所述第一步数小于或等于所述第二步数;
在进行若干轮同步融合训练并直至触发预设的训练结束条件时,得到相应于各所述待定翻译模型的最终模型;
将至少一个所述最终模型作为目标翻译模型。
2.根据权利要求1所述的机器翻译模型构建方法,其特征在于,所述多模型混合训练策略包括:
每训练预设的第二步数后,将每种所述待定翻译模型经训练更新后的当前状态作为对应该所述待定翻译模型的第一模型;
从所述当前最优模型中选择若干个第二模型,所述第二模型包括:除任一所述第一模型对应的所述当前最优模型以外的其他所述当前最优模型;
利用所述第二模型的输出指导相应的所述第一模型的训练。
3.根据权利要求2所述的机器翻译模型构建方法,其特征在于,所述从所述当前最优模型中选择若干个第二模型包括:
在保存所述当前最优模型时,基于所述语料集以及预设的指标,评估各所述待定翻译模型的当前训练效果的优劣程度;
基于所述优劣程度以及预设的阈值,从所述当前最优模型中选择所述第二模型。
4.根据权利要求2所述的机器翻译模型构建方法,其特征在于,所述从所述当前最优模型中选择若干个第二模型包括:
基于相对所述第一模型的结构差异和/或参数差异,从所述当前最优模型中选择所述第二模型。
5.根据权利要求2~4任一项所述的机器翻译模型构建方法,其特征在于,所述利用所述第二模型的输出指导相应的所述第一模型的训练包括:
使所述第一模型的输出概率分布接近所述第二模型的输出概率分布。
6.根据权利要求5所述的机器翻译模型构建方法,其特征在于,所述利用所述第二模型的输出指导相应的所述第一模型的训练还包括:
在各所述第二步数内,利用经所述第一步数保存的当前最优第二模型的输出指导相应的所述第一模型的训练。
7.一种机器翻译模型构建装置,其特征在于,包括:
待定模型构建模块,用于预先构建多个待定翻译模型,所述待定翻译模型之间具有不同的结构和/或不同的参数;
独立训练模块,用于利用预设的语料集分别对各所述待定翻译模型进行独立训练;
当前最优模型保存模块,用于每训练预设的第一步数后,将各所述待定翻译模型的当前最优模型予以保存;
同步融合训练模块,用于每训练预设的第二步数后,对各所述待定翻译模型进行独立训练的同时,结合所述当前最优模型以及预设的多模型混合训练策略,对各所述待定翻译模型进行同步融合训练,其中,所述第一步数小于或等于所述第二步数;
最终模型获取模块,用于在进行若干轮同步融合训练并直至触发预设的训练结束条件时,得到相应于各所述待定翻译模型的最终模型;
目标翻译模型确定模块,用于将至少一个所述最终模型作为目标翻译模型。
8.一种机器翻译模型构建设备,其特征在于,包括:
一个或多个处理器、存储器以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行权利要求1~6任一项所述的机器翻译模型构建方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得计算机执行权利要求1~6任一项所述的机器翻译模型构建方法。
10.一种计算机程序产品,其特征在于,当所述计算机程序产品被计算机执行时,用于执行权利要求1~6任一项所述的机器翻译模型构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011605010.X/1.html,转载请声明来源钻瓜专利网。





