[发明专利]一种基于拼接的集成式自动译后编辑系统及方法有效
申请号: | 201710492040.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107301174B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 黄河燕;曹倩雯;郭宇航 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06N3/08 |
代理公司: | 11639 北京理工正阳知识产权代理事务所(普通合伙) | 代理人: | 鲍文娟 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于拼接的集成式自动译后编辑系统与方法,属于计算机自然语言处理及机器翻译技术领域。包括本系统,又包括训练模块与解码模块;本方法分为训练过程与解码过程。训练过程建立在传统的神经网络机器翻译模型基础之上,源语料用训练原文与多种机器翻译系统的译文以一定顺序在语句级别拼接后生成的训练语料做替换,输出译后编辑系统;解码过程以训练过程输出的系统、翻译原文与机器翻译译文按照相同顺序拼接生成的翻译语料作为输入,输出经过本系统校正的译后编辑译文。本发明的优势在于以较低的代价集成了翻译原文与多种机器翻译结果,既提供了完整的语义支持,也体现多种机器翻译系统的优势,从而提高了整体翻译质量。 | ||
搜索关键词: | 一种 基于 拼接 集成 自动 编辑 系统 方法 | ||
【主权项】:
1.一种基于拼接的集成式自动译后编辑系统,其特征在于:集成指可用多种不同源语言的组合作为译后编辑的输入,包括多种不同的机器翻译译文与翻译原文;/n所述系统能够使得翻译原文与多种不同的机器翻译译文在译后编辑过程中相互影响,以翻译原文验证信息量的完备性,以多种机器翻译译文验证翻译错误的完备性,提高翻译的忠实度,进而提高译后编辑结果的整体质量;/n所述系统包括训练模块与解码模块;/n各模块的功能如下:/n训练模块的功能是训练基于拼接的集成式自动译后编辑系统,即本系统基于神经网络翻译模型输出已训练模型;此已训练模型又称为译后编辑系统模型;/n解码模块的功能是利用训练模块输出的译后编辑系统模型进行解码;/n各模块之间的连接关系如下:/n训练模块与解码模块相连,具体通过训练模块输出的已训练模型,即译后编辑系统模型相连;/n为实现上述目的,所采用的技术方案如下:/n定义1:设置一个常数K,代表机器翻译系统,称为Machine Translation系统,即MT系统,MT系统共有K个,具体记作:MT
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710492040.6/,转载请声明来源钻瓜专利网。