[发明专利]一种构建机器翻译模型的方法、翻译装置及计算机可读存储介质在审

专利信息
申请号: 201911243004.1 申请日: 2019-12-06
公开(公告)号: CN112926342A 公开(公告)日: 2021-06-08
发明(设计)人: 蔡岩松;屠要峰;郭斌;周祥生 申请(专利权)人: 中兴通讯股份有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/216;G06F40/289;G06F16/215;G06N3/04;G06N3/08
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 梁嘉琦
地址: 518057 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 构建 机器翻译 模型 方法 翻译 装置 计算机 可读 存储 介质
【说明书】:

发明公开了一种构建机器翻译模型的方法,包括:构建用于通用领域的基础机器翻译模型;基于基础机器翻译模型,向特定领域进行微调,以构建用于特定领域的机器翻译模型。本发明还公开了一种对应的翻译装置和计算机可读存储介质。通过微调机制,实现翻译效果以及翻译模型开发时间的综合提升。

技术领域

本发明实施例涉及但不限于机器翻译技术领域,尤其涉及一种构建机器翻译模型的方法、翻译装置及计算机可读存储介质。

背景技术

机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。

机器翻译具有重要的实用价值,机器翻译相较于人工翻译具有三个明显的优势:成本低、易把控以及翻译速度快。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译。

目前流行的翻译系统主要的都是针对通用领域的翻译,在面对一些专有领域的很多场景下效果却不是很好,比如医疗领域、金融领域,以及法律合规领域。而重新开发专有领域的翻译系统需要花费大量的人力和物力。因此,需要一种不仅翻译效果良好,开发效率高的适用于专有领域的翻译系统。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

一方面,本发明实施例提供了一种利用微调构建机器翻译模型的方法,以提高开发效率,提升翻译效果,所述方法,包括:

构建用于通用领域的基础机器翻译模型;

基于所述基础机器翻译模型,向特定领域进行微调,以构建用于特定领域的机器翻译模型。

另一方面,本发明实施例提供了一种翻译装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的构建机器翻译模型的方法。

再一方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述的构建机器翻译模型的方法。

本发明实施例包括:基于通用领域训练数据集,获得适用于通用领域的基础机器翻译模型;利用所获得的基础机器翻译模型,基于特定领域训练数据集,调整模型的超参数:学习率,向特定领域进行微调,以构建用于特定领域的结果机器翻译模型。由此,根据本发明的实施例,创新性地将微调的思想应用到机器翻译的领域适应迁移上,实现翻译效果以及翻译模型开发时间的综合提升。同时,还创新性的对经典转换器架构进行相关参数的调整,实现整体效果的提升。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1是本发明一个实施例的利用微调构建机器翻译模型的方法整体流程图;

图2是本发明一个实施例利用微调构建机器翻译模型的方法中的数据预处理的流程图;

图3是本发明一个实施例利用微调构建机器翻译模型的方法中的关键词保护处理的流程图;

图4是本发明一个实施例利用微调构建机器翻译模型的方法中的词表处理的流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911243004.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top