[发明专利]一种机器翻译方法、装置、电子设备和介质在审
| 申请号: | 201811542438.7 | 申请日: | 2018-12-17 |
| 公开(公告)号: | CN109697292A | 公开(公告)日: | 2019-04-30 |
| 发明(设计)人: | 张睿卿;何中军;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 源语言句 机器翻译 粗分类 翻译 目标语言翻译 分类 电子设备 细分类 类别分类 手动选择 自动识别 维度 清晰 | ||
本发明实施例公开了一种机器翻译方法、装置、电子设备和介质,该方法包括:获取待翻译的源语言句;利用预先训练的机器翻译模型,同时给出所述源语言句的目标语言翻译结果,以及所述源语言句所属的类别,其中,所述类别包括粗分类和粗分类下所属的细分类,所述机器翻译模型用于结合对源语言句的分类任务给出目标语言翻译结果。本发明实施例免去用户手动选择领域的麻烦,同时执行分类任务和翻译任务,并且在分类任务中给出粗分类和粗分类下所属的细分类,而不是在同一个维度上对各领域进行分类,使得模型在类别分类阶段更有针对性,不仅能够自动识别源语言句所述的类别和领域,同时使得各领域所负责的翻译内容界限更为清晰,提升翻译效果。
技术领域
本发明实施例涉及机器翻译技术领域,尤其涉及一种机器翻译方法、装置、电子设备和介质。
背景技术
随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译在如今的翻译领域扮演着重要角色,有着高速、低成本的优势,可以为普通用户提供实时便捷的翻译服务。
机器翻译中,对于专业领域的文本,分领域地训练翻译模型可以大幅提高对应领域的翻译效果。当前有部分互联网翻译系统,通过引入领域信息,针对每个领域进行数据和模型上的优化,达到了翻译效果的提升。但是这些领域的分类比较随意,没有系统性,在同一个维度上划分各领域,造成领域混淆,影响翻译效果。而且在具体实现的过程中,通常需要用户先手动选择一个目标领域,再由相应模型针对性的给出翻译文本,操作繁琐,影响翻译效率。
发明内容
本发明实施例提供一种机器翻译方法、装置、电子设备和介质,以解决现有技术中自动翻译准确率低以及效率低的问题。
第一方面,本发明实施例提供了一种机器翻译方法,所述方法包括:
获取待翻译的源语言句;
利用预先训练的机器翻译模型,同时给出所述源语言句的目标语言翻译结果,以及所述源语言句所属的类别,其中,所述类别包括粗分类和粗分类下所属的细分类,所述机器翻译模型用于结合对源语言句的分类任务给出目标语言翻译结果。
第二方面,本发明实施例还提供了一种机器翻译装置,所述装置包括:
源语言句获取模块,用于获取待翻译的源语言句;
源语言句翻译模块,用于利用预先训练的机器翻译模型,同时给出所述源语言句的目标语言翻译结果,以及所述源语言句所属的类别,其中,所述类别包括粗分类和粗分类下所属的细分类,所述机器翻译模型用于结合对源语言句的分类任务给出目标语言翻译结果。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种机器翻译方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的一种机器翻译方法。
本发明实施例通过获取待翻译的源语言句;利用预先训练的机器翻译模型,同时给出所述源语言句的目标语言翻译结果,以及所述源语言句所属的类别,其中,所述类别包括粗分类和粗分类下所属的细分类,所述机器翻译模型用于结合对源语言句的分类任务给出目标语言翻译结果,一方面免去用户手动选择领域的麻烦,另一方面,可以同时执行分类任务和翻译任务,并且在分类任务中给出粗分类和粗分类下所属的细分类,而不是在同一个维度上对各领域进行分类,使得模型在类别分类阶段更有针对性,不仅能够自动识别源语言句所述的类别和领域,同时使得各领域所负责的翻译内容界限更为清晰,提升翻译效果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542438.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本的语义段落识别方法和装置
- 下一篇:含有可编程计算单元的可编程门阵列





