[发明专利]一种神经网络蒙汉机器翻译方法有效
申请号: | 201711066025.1 | 申请日: | 2017-11-02 |
公开(公告)号: | CN107967262B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 苏依拉;乌尼尔;刘婉婉;牛向华;赵亚平;王宇飞;张振;孙晓骞;高芬 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 机器翻译 方法 | ||
1.一种神经网络蒙汉机器翻译方法,首先对大规模蒙汉双语语料做规范化处理,在此基础上构建出双语字典;然后进行建模,最终基于所搭建模型,实现机器翻译;所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模,从而针对蒙古语特定词性的词语进行相应处理,以达到最好的翻译效果和最小的语义困惑度,其特征在于,所述基于所搭建模型,实现机器翻译的步骤包括编码环节和解码环节,所述编码环节,将蒙古语进行向量化处理并确定维度;所述解码环节分为注意力层部分和解码部分,其中注意力层部分为对齐概率计算模型和对齐位置预测模型;通过对齐概率计算模型计算出蒙汉双语在句子对齐的基础上,词语之间对齐的概率,而对齐位置预测模型能够将每个词出现的位置信息进行相应的预测;所述解码部分又分为遍历隐藏层节点和输出两部分,通过遍历隐藏层节点来对当前时刻的向量信息进行检索,判定是否符合语义要求,若符合语义要求则将符合要求的向量信息传送给输出函数,通过归一化操作将输出向量解码为译文进行输出,且输出函数符合最优值。
2.根据权利要求1所述神经网络蒙汉机器翻译方法,其特征在于,所述编码器共有三种,分别为单词编码器、字素编码器和短语编码器;
单词编码器用于源端语言的向量化,将每个单词表示成向量形式,最终构建以单词向量为基础的句向量,其模型公式为:
ht=φ(ht-1,Cwt)
其中,ht为t时刻编码器神经网络隐藏层状态,ht-1为t-1时刻编码器神经网络隐藏层状态,φ为神经网络激活函数,C为映射矩阵,wt为蒙古语词的向量,通过编码终止符EOS来确定编码的完成,当t为0时刻,h0就是一个全零的向量,当编码结束时,神经网络中即包含所有蒙古语语言信息;
字素编码器用于缓解源语料和带翻译语料中出现的错误词语,以构词字素为基本单元来遍历检索和编码源语言句子,当出现错误单词时将单词中错误的字素替换为正确字素从而达到改错目的,其模型公式为:
htc=ψ(h(t-1)c,Ccwtc)
其中,htc为t时刻字素编码器的网络隐藏层状态,h(t-1)c为t-1时刻字素编码器的网络隐藏层状态,ψ为激活函数,Cc为字素的映射矩阵,wtc为蒙古语构词字素的向量表示;
短语编码器用于将源语言句子中成组出现的短语作为编码器的基本单元进行编码,通过对源语言句子的短语划分来构建基于字典的短语库,进而构建短语编码器,其模型公式为:
htp=γ(h(t-1)p,Cpwtp)
其中,htp为t时刻短语编码器的网络隐藏层状态,h(t-1)p为t-1时刻短语编码器的网络隐藏层状态,γ为神经网络隐藏层节点激活函数,Cp为短语映射矩阵,wtp为蒙古语句子包含短语的向量表示;
通过一个融合函数将三种编码器中编码信息进行融合,融合函数中的融合因子为三种编码器在编码条件下对应的激活函数,通过加权得到,如下式所示:
Γ(ht,htc,htp)=α1ht+α2htc+α3htp
混合编码器的模型公式为:
hh=Γ(ht,htc,htp)
其中,Γ为融合函数,包含三种激活函数集合,α1,α2,α3表示三种编码器通过随机初始化的对应权重,通过加入三种编码状态整合成为包含字素、单词、短语三类向量信息的编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711066025.1/1.html,转载请声明来源钻瓜专利网。