[发明专利]交互式机器翻译方法、装置、设备和介质有效
申请号: | 202010099491.5 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111339788B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 李磊;王明轩;周浩;孙泽维 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互式 机器翻译 方法 装置 设备 介质 | ||
本公开实施例公开了一种交互式机器翻译方法、装置、设备和介质。该方法包括:获取用户输入的源语句;将源语句翻译成第一目标语句;确定用户是否调整第一目标语句中的第一词汇;响应于确定用户调整第一目标语句中的第一词汇,获取用于替换所述第一词汇的第二词汇,以及基于第二词汇调整第一目标语句中的位于第一词汇之前和之后的词汇序列,以生成第二目标语句。基于本公开的交互式机器翻译方法,用户可以先对翻译结果中任意位置处出现的最明显错误进行修改,之后该方法可以基于用户的修改适应性地调整出错位置前后的翻译结果,从而减少人的主动纠错的操作次数,可以显著地提高交互的效率,并提高翻译结果的准确性。
技术领域
本公开实施例涉及机器翻译技术领域,具体涉及一种交互式机器翻译方法、装置、设备和介质。
背景技术
机器翻译多采用序列到序列(seq2seq)模型将一种语言的文本翻译成另一种语言的文本。序列到序列模型主要包括两个部分,即编码器和解码器。编码器和解码器各自可以采用神经网络来实现。序列到序列模型的工作流程为:将源语句切分成词序列,输入编码器,编码器输出隐含层的向量;隐含层向量作为解码器的输入,可在每个时间点生成一个目标词汇,一个目标词汇是基于隐含层和前一个输出的目标词汇来生成的。最终目标词汇序列就构成了机器翻译的目标语句。
机器翻译模型到目前为止,还是不如人工翻译精准,所以对于翻译得到的目标语句,经常会存在需要人工调整的情况。一般而言,在翻译结果中往往存在多处错误,从而可能需要用户进行多次甚至是大量的纠正,才能达到准确的翻译目的。
发明内容
鉴于此,本公开实施例提供一种交互式机器翻译方法、装置、电子设备、及存储介质,以减少人工干预的次数并提高翻译质量和翻译效率。
在本公开的第一方面,提供了一种交互式机器翻译方法。该方法包括:获取用户输入的源语句;将所述源语句翻译成第一目标语句;确定所述用户是否调整所述第一目标语句中的第一词汇;响应于确定所述用户调整所述第一目标语句中的第一词汇,获取用于替换所述第一词汇的第二词汇,基于所述第二词汇调整所述第一目标语句中的位于所述第一词汇之前和之后的词汇序列,以生成第二目标语句。
在本公开的第二方面,提供了一种交互式机器翻译装置。该装置包括:源语句获取单元,用于获取用户输入的源语句;语句翻译单元,用于将所述源语句翻译成第一目标语句;调整确定单元,用于确定所述用户是否调整所述第一目标语句中的第一词汇;调整响应单元,用于响应于确定所述用户调整所述第一目标语句中的第一词汇,获取用于替换所述第一词汇的第二词汇,以及基于所述第二词汇调整所述第一目标语句中的位于所述第一词汇之前和之后的词汇序列,以生成第二目标语句。
在本公开的第三方面,提供了一种电子设备。该电子设备包括:处理器;以及存储器,用于存储可执行指令,所述可执行指令在被所述处理器执行时使得所述电子设备执行第一方面中的方法。
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面中的方法。
本公开实施例获取用户输入的源语句后翻译成第一目标语句,若确定所述用户调整该第一目标语句中的第一词汇,响应于该调整操作,获取用于替换所述第一词汇的第二词汇,以及基于所述第二词汇调整所述第一目标语句中的位于所述第一词汇之前和之后的词汇序列,以生成第二目标语句。基于本公开的交互式机器翻译方法,用户可以先对翻译结果中任意位置处出现的最明显错误进行修改,之后该方法不仅可以基于用户的修改适应性地调整出错位置之后的翻译结果,还可以调整出错位置之前的翻译结果,从而减少人的主动纠错的操作次数,可以显著地提高交互的效率,并提高翻译结果的准确性。
提供发明内容部分是为了以简化的形式来介绍对概念的标识,其在下文的具体实施方式中将被进一步描述。发明内容部分无意标识要求保护的技术方案的关键特征或主要特征,也无意限制要求保护的技术方案的范围。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010099491.5/2.html,转载请声明来源钻瓜专利网。