[发明专利]一种基于神经网络结构搜索的机器翻译译文质量评估方法有效
申请号: | 202110414498.6 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113033218B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 杜权 | 申请(专利权)人: | 沈阳雅译网络技术有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/58;G06N3/045;G06N3/0442;G06N3/08 |
代理公司: | 沈阳新科知识产权代理事务所(特殊普通合伙) 21117 | 代理人: | 李晓光 |
地址: | 110004 辽宁省沈阳市*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 结构 搜索 机器翻译 译文 质量 评估 方法 | ||
本发明公开一种基于神经网络结构搜索的机器翻译译文质量评估方法,步骤为:获取WMT质量评估任务的训练数据和WMT机器翻译任务中的训练数据;确定预测器‑评估器模型中的预测器组件,使用基于进化算法的搜索策略进行预搜索;搭建经典的预测器‑评估器模型,实行基于进化算法的搜索策略的最初使用Transformer神经机器翻译模型来热启动初始化种群;使用基于进化算法的搜索策略进行预搜索;对预测器部分的网络结构进行微调及训练调优;使用完整模型进行质量评估的单词级任务,并使用其在测试集上的准确度表征模型性能。本发明利用网络结构搜索技术,针对质量评估的任务和数据特性为预测器组件量身定制网络结构。
技术领域
本发明涉及一种机器翻译译文质量评估技术,具体为一种基于神经网络结构搜索的机器翻译译文质量评估方法。
背景技术
近几年来,随着深度学习技术的广泛传播与使用,基于神经网络的方法在很多领域都取得了惊人的成功。基于神经网络的方法在具体任务上的性能往往取决于神经网络的结构,因而研究人员的大部分精力都集中于设计出更优秀的网络结构。随着各领域研究的不断推进,越来越多优秀的神经网络结构被提出,应用于各类任务的神经网络结构也变得越来越复杂,这就意味着依靠人工设计神经网络结构的试错成本和时间成本会变得更加难以承受,由此,结构搜索技术应运而生。
结构搜索技术是一种在给定的搜索空间下,通过设计经济高效的搜索方法,自动获取性能更好、泛化能力更强的神经网络结构的技术,旨在将研究人员从大量的脑力劳动中解脱出来。目前,结构搜索技术有几种主流方法:基于梯度的网络结构搜索方法、基于进化算法的结构搜索方法、基于强化学习的结构搜索方法以及基于贝叶斯优化的结构搜索方法。
译文质量评估是机器翻译中一个重要的领域,它能在不依赖参考译文的情况下对译文质量做出判断,包括判断单词正误、对句子或文档进行打分等等。目前解决该任务最为经典的结构就是预测器-评估器模型,其中负责特征提取的预测器网络结构往往很复杂。由于质量评估相关数据的匮乏,研究人员往往直接使用训练好的翻译模型或各种预训练模型充当预测器。评估器的网络结构则很简单,往往直接采用双向RNN网络。
由于不能保证翻译模型和预训练模型足够适合质量评估任务,本发明将借助神经网络结构搜索技术为预测器量身定制网络结构。目前网络结构搜索方法大多应用于图像分类和语言建模等比较轻量级的任务,那是因为神经网络结构搜索的实现对设备的计算能力具有极高的要求,而轻量级的网络结构搜索更有可能在现有的设备上实现。类似于质量评估这类任务,其神经网络结构本身就比较复杂,将结构搜索技术应用于该任务具有一定难度。
发明内容
针对现有质量评估任务经典的预测器-评估器模型中预测器组件的网络结构并不完全适合质量评估任务的现状,本发明提供一种基于神经网络结构搜索的机器翻译译文质量评估方法,借助网络结构搜索技术对预测器组件的网络结构进行搜索,从而进一步提高模型性能。
为了实现上述内容,本发明采用的技术方案是:
本发明提供一种基于神经网络结构搜索的机器翻译译文质量评估方法,包括以下步骤:
1)获取WMT质量评估任务的训练数据和WMT机器翻译任务中的训练数据;
2)确定将要实施网络结构搜索技术的部分为预测器-评估器模型中的预测器组件,根据组件结构和功能特性确定搜索空间,同时确定将使用基于进化算法的搜索策略进行预搜索;
3)搭建经典的预测器-评估器模型,其中评估器部分的结构直接使用传统模型中的双向GRU模型,预测器部分则根据搜索空间和搜索策略进行搭建,实行基于进化算法的搜索策略的最初使用Transformer神经机器翻译模型来热启动初始化种群;
4)将神经机器翻译作为目标任务,机器翻译双语数据作为训练数据,使用基于进化算法的搜索策略进行预搜索;
5)利用WMT质量评估任务的数据对预测器部分的网络结构进行微调;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司,未经沈阳雅译网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110414498.6/2.html,转载请声明来源钻瓜专利网。