[发明专利]一种博弈型蒙古文神经机器翻译方法在审
申请号: | 202210276166.0 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114818742A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 吉亚图;孙宝磊;巴音图;师磊;樊静;仁庆道尔吉;苏依拉 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 博弈 蒙古文 神经 机器翻译 方法 | ||
1.一种博弈型蒙古文神经机器翻译方法,其特征在于,包括如下步骤:
步骤1,将蒙古文神经机器翻译中影响译文解码的问题因素通过伪数据的形式转化为干扰噪声;
步骤2,在机器翻译任务上,根据噪声干扰策略构建基于生成对抗网络的博弈模型,所述博弈模型由三部分组成:生成器G、抗干扰器AJ和鉴别器D,其中抗干扰器AJ置于生成器G和鉴别器D之间,生成器G旨在欺骗鉴别器D使其认为输出是标准译文,鉴别器D旨在提高其鉴别能力以区分生成器G的输出和标准译文,抗干扰器AJ旨在使干扰噪声序列能够在训练中被鉴别器D鉴别;
步骤3,在博弈训练中,利用REINFORCE策略对生成器G进行参数优化,得到原始数据和噪声数据的训练价值,然后借助对抗训练机制对原始语料和含干扰噪声的伪语料训练,利用得到的训练价值进一步决策噪声数据的训练优先级,以使生成器G和D对添加的干扰噪声产生足够的解码能力,最终以训练得到的生成器G为翻译模型,进行蒙古文翻译。
2.根据权利要求1所述博弈型蒙古文神经机器翻译方法,其特征在于,所述步骤1中,影响译文解码的问题因素包括蒙古文语料中的未登录词、词缀变形、格附加成分、指代词以及特殊字符,通过对所述问题因素进行掩膜和替换操作,形成与原始语料序列结构相同语义相似的含干扰噪声的伪语料;所述噪声干扰策略是指利用对抗训练机制对原始语料和伪语料训练解码,并在训练过程中增强对添加噪声的泛化能力。
3.根据权利要求1所述博弈型蒙古文神经机器翻译方法,其特征在于,所述步骤2中,采用多层感知机模型作为生成器G,并采用CNN设计构建鉴别器D,鉴别器D的目标是对根据干扰噪声解码的译文和标准译文进行二分类鉴别。
4.根据权利要求1或3所述博弈型蒙古文神经机器翻译方法,其特征在于,所述REINFORCE策略基于REINFORCE算法,在解码过程中将所述REINFORCE策略与GAN训练过程进行比较和映射:(1)首先将REINFORCE策略中的智能体与生成器G映射,从而完成生成器G与状态空间s∈S的交互;(2)将生成器G的参数状态与REINFORCE策略映射,利用每个时间步的动作a∈A完成下一时间步单词y′t的预测;(3)将评价指标与激励函数R(s,a)映射,计算序列的奖励。
5.根据权利要求1所述博弈型蒙古文神经机器翻译方法,其特征在于,所述步骤2中,抗干扰器AJ基于卷积值迭代构建,REINFORCE策略采用序列级的BLEU值奖励作为相应的解码价值,根据一种动态的价值决策方法,确定含噪数据与普通数据的训练价值,从而根据奖励价值得到样本的训练优先级,优先训练含噪多价值低的样本。
6.根据权利要求5所述博弈型蒙古文神经机器翻译方法,其特征在于,所述卷积值迭代,是通过提供当前时间步t的解码状态st和动作at来编码下一个状态的概率,即当前价值是从st开始执行REINFORCE策略时所获得的奖励总和的期望值,并且状态随转移概率而更新。
7.根据权利要求5所述博弈型蒙古文神经机器翻译方法,其特征在于,对于博弈模型的整体训练,采用误差反向传播作为鉴别器D对生成器G的反馈方式,使值迭代适应博弈模型的前馈计算和参数更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210276166.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:有机发光器件
- 下一篇:一种阻燃式防潮的母线槽装置