[发明专利]一种机器翻译质量评估方法、装置、设备和存储介质在审
申请号: | 202210970061.5 | 申请日: | 2022-08-12 |
公开(公告)号: | CN115310460A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 陶大程;丁亮;陆清屿 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/58;G06F40/194 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 郭德霞 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器翻译 质量 评估 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种机器翻译质量评估方法、装置、设备和存储介质,应用于自然语言处理技术领域。该方法包括:获取待评估的翻译文本对,翻译文本对包括源语种对应的源文本和翻译后的目标语种对应的目标文本;基于至少两种质量评估指标和源文本,对目标文本进行质量评估,确定每种质量评估指标对应的评估结果;基于源语种与目标语种之间的语种相似度,确定每种质量评估指标对应的评估权重;基于各个评估权重,对各个评估结果进行融合处理,确定翻译文本对的目标评估结果。通过本发明实施例的技术方案,可以综合评估翻译质量,并且保证不同语种对的翻译评估准确度。
技术领域
本发明实施例涉及自然语言处理技术领域,尤其涉及一种机器翻译质量评估方法、装置、设备和存储介质。
背景技术
随着计算机技术的快速发展,往往需要对利用机器翻译模型翻译出的文本质量进行评估。
目前,可以基于翻译质量评估模型,对翻译后的文本进行质量评估。例如,基于句子级别标注数据进行训练获得的评估模型对翻译文本进行质量评估,获得的指标评估结果偏向于表征翻译文本的整体流畅度。或者,基于词级别标注数据进行训练获得的评估模型对翻译文本进行质量评估,获得的指标评估结果偏向于表征翻译文本的忠实度。
然而,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
利用每种翻译质量评估模型获得的指标评估结果仅能偏向于评估翻译文本单一层面的质量情况,比如翻译文本的整体流畅度或者忠实度,无法综合评估出翻译质量,并且对不同语种对的翻译文本均采用相同的评估方式,进而导致不同语种对的翻译评估准确度差异较大的现象。
发明内容
本发明实施例提供了一种机器翻译质量评估方法、装置、设备和存储介质,以综合评估翻译质量,并且保证不同语种对的翻译评估准确度。
第一方面,本发明实施例提供了一种机器翻译质量评估方法,包括:
获取待评估的翻译文本对,所述翻译文本对包括源语种对应的源文本和翻译后的目标语种对应的目标文本;
基于至少两种质量评估指标和所述源文本,对所述目标文本进行质量评估,确定每种所述质量评估指标对应的评估结果;
基于所述源语种与所述目标语种之间的语种相似度,确定每种所述质量评估指标对应的评估权重;
基于各个所述评估权重,对各个所述评估结果进行融合处理,确定所述翻译文本对的目标评估结果。
第二方面,本发明实施例还提供了一种机器翻译质量评估装置,包括:
翻译文本对获取模块,用于获取待评估的翻译文本对,所述翻译文本对包括源语种对应的源文本和翻译后的目标语种对应的目标文本;
评估结果确定模块,用于基于至少两种质量评估指标和所述源文本,对所述目标文本进行质量评估,确定每种所述质量评估指标对应的评估结果;
评估权重确定模块,用于基于所述源语种与所述目标语种之间的语种相似度,确定每种所述质量评估指标对应的评估权重;
评估结果融合模块,用于基于各个所述评估权重,对各个所述评估结果进行融合处理,确定所述翻译文本对的目标评估结果。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的机器翻译质量评估方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210970061.5/2.html,转载请声明来源钻瓜专利网。