[发明专利]一种翻译模型训练方法、文本翻译方法及相关装置有效
申请号: | 201910595220.6 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110298046B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 章杰;宋锐;张为泰;刘俊华;王智国 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/47 | 分类号: | G06F40/47 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 模型 训练 方法 文本 相关 装置 | ||
本申请公开了一种翻译模型训练方法、文本翻译方法及相关装置,在该方法中,将至少一个样本文本中输入双向翻译模型,以便根据双向翻译模型的输出结果对双向翻译模型进行参数更新,其中,双向翻译模型的输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋,且该预测词袋是朝着对应样本文本的实际词袋的方向预测得到的,该实际词袋包括对应样本文本的实际翻译文本中的各个不同词,因此,在对模型进行参数更新时,需要基于每一样本文本的预测词袋与其实际词袋之间的差异进行参数更新,使得该实际词袋可以用于指导翻译方向,故而,训练完成的双向翻译模型能够朝着输入样本文本的实际词袋的方向进行准确翻译。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种翻译模型训练方法、文本翻译方法及相关装置。
背景技术
近年来,自然语言处理的研究已经成为热点,而机器翻译是自然语言研究领域的一个重要分支,也是人工智能领域的一个重要课题。机器翻译,是利用计算机将一种源语言自动转换为另一种目标语言的过程,历史上出现过很多机器翻译方法,例如,基于规则的机器翻译方法、基于统计的机器翻译方法、以及基于神经网络的机器翻译方法等。
目前,为了实现机器翻译,需要针对特定的翻译方向训练对应的翻译模型,例如,针对中译英翻译训练一个中译英翻译模型、针对英译中翻译再训练一个英译中翻译模型。即,对于中英互译系统来说,需要训练优化两个不同方向的翻译模型,这对于人力和服务器计算资源来说,都是一种消耗和浪费。
发明内容
本申请实施例的主要目的在于提供一种翻译模型训练方法、文本翻译方法及相关装置,能够训练得到一个实现双向翻译的单一模型,从而节省了人力和计算机资源的消耗和浪费。
本申请实施例提供了一种翻译模型训练方法,包括:
将至少一个样本文本输入双向翻译模型,所述至少一个样本文本包括双向翻译方向中的至少一个语种类型下的文本数据;
获取所述双向翻译模型的输出结果,所述输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋,所述预测词袋是朝着对应样本文本的实际词袋的方向预测得到的,所述实际词袋包括对应样本文本的实际翻译文本中的各个不同词;
根据所述输出结果对所述双向翻译模型进行参数更新,以完成本轮训练。
可选的,所述方法还包括:
收集所述双向翻译方向中的每一语种类型下的文本语料;
从所述每一语种类型下的文本语料中提取高频词,利用每一高频词以及该高频词的表示结果构成一个双语词典;
则,所述将至少一个样本文本输入双向翻译模型,包括:
确定所述至少一个样本文本中的属于所述双语词典的词,并将所确定的词的表示结果输入双向翻译模型。
可选的,所述获取所述双向翻译模型的输出结果,包括:
对于每一样本文本,利用所述双向翻译模型,生成所述样本文本的预测翻译文本,并且,根据所述双向翻译模型的解码层输出的对应于所述样本文本的各个隐状态表示结果,生成所述样本文本的预测词袋。
可选的,所述根据所述双向翻译模型的解码层输出的对应于所述样本文本的各个隐状态表示结果,生成所述样本文本的预测词袋,包括:
将所述双向翻译模型的解码层输出的对应于所述样本文本的各个隐状态表示结果进行线性计算,得到线性计算结果;
根据所述线性计算结果,生成所述样本文本对应的预测词袋。
可选的,所述根据所述输出结果对所述双向翻译模型进行参数更新,包括:
根据所述输出结果以及目标函数,对所述双向翻译模型进行参数更新;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910595220.6/2.html,转载请声明来源钻瓜专利网。