[发明专利]一种基于强化学习的蒙汉双语种互译方法有效
申请号: | 201810428143.0 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108920468B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 苏依拉;高芬;张振;王宇飞;孙晓骞;牛向华;赵亚平 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 强化学习 翻译 机器翻译 行为策略 互译 奖赏 句子 少数民族语言 双语对齐语料 解码器架构 质量最大化 反馈 决策过程 数学框架 训练过程 最优策略 编码器 有效地 预期的 标量 语料 平行 折扣 汉语 神经 期望 学习 | ||
编码器‑解码器架构的神经机器翻译(NMT)在当前的标准机器翻译基准上实现了最佳的结果,但由于训练该模型需要大量平行语料数据,对于少数民族语言翻译领域而言,普遍面临双语对齐语料不足,资源稀少,因此本发明提供一种基于强化学习的蒙汉双语种互译方法。系统接受一个蒙语句子来翻译,生成一个汉语句子,并且得到一个标量分数作为反馈。利用强化学习技术,从反馈中有效地学习。在强化学习中定义解法的数学框架叫做马尔科夫决策过程。目标是找到一个策略使得预期的翻译质量最大化。在训练过程中,如果某个行为策略导致环境大的奖赏,那么以后产生这个行为策略的趋势便会加强,最终找到最优策略以使期望的折扣奖赏和最大,使得翻译质量提高。
技术领域
本发明属于机器学习技术领域,特别涉及一种基于强化学习的蒙汉双语种互译方法。
背景技术
随着Internet的普遍应用,世界经济一体化进程的加速以及国际社会交流日渐频繁,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。
在我国经济快速发展与社会不断进步的背景下,蒙古族与汉族的之间的交流日益频繁,而蒙古语是我国蒙古族同胞使用的主要语言,并且蒙语作为蒙古国的官方语言,因此蒙汉机器翻译的研究对于两种文化的价值观相互渗透,凝聚民族的核心文化,促进良好民族关系的建立以及促进和蒙古国之间的对外贸易和文化交流都具有重要意义。
目前,编码器-解码器架构的神经机器翻译(NMT)在当前的标准机器翻译基准上实现了最佳的结果,并且也已经在业界的翻译服务核心得到了应用。NMT模型由编码器和解码器两者组成,二者均采用循环神经网络(Recurrent Neural Network,RNN)结构。可使用双向的RNN作为编码器和单向的RNN作为解码器,这个框架从源语言句子a={a1,a2,...,an}到正确的双语库目标语言句子b={b1,b2,...,bm}学习了一个概率映射Pθ(b|a),其中an和bm分别是源语言句子a的第n个词和正确双语库目标语言句子b的第m个词。
注:bt:双语库中目标语言句子b的第t个词。
b<t:bt先前的词。
每一个局部分布式Pθ(b|b<t,a)通过目标词汇建模成一个多项式分布。根据softmax函数,把公式(1)线性转化,解码器输出矢量
ct=attend(s'1:n,st) (4)
注:attend(.,.):一种注意力机制
τ:softmax函数的参数
s:解码器生成的隐藏向量
s':编码器生成的隐藏向量
在一个监督的学习框架中,一个NMT模型通常是在最大的逻辑可能性下进行训练的,但由于训练该模型需要大量平行语料数据,才能得到比较好的结果。但是对于少数民族语言翻译领域而言,此类翻译任务普遍面临双语对齐语料不足,资源稀少,翻译研究时间短,成果少等困难。并且平行语料库的获得成本非常之高,且需要相对应的专业知识。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810428143.0/2.html,转载请声明来源钻瓜专利网。