[发明专利]一种机器翻译质量评估方法、装置、设备和存储介质在审

申请号：	202210970061.5	申请日：	2022-08-12
公开（公告）号：	CN115310460A	公开（公告）日：	2022-11-08
发明（设计）人：	陶大程;丁亮;陆清屿	申请（专利权）人：	京东科技信息技术有限公司
主分类号：	G06F40/51	分类号：	G06F40/51;G06F40/58;G06F40/194
代理公司：	北京品源专利代理有限公司 11332	代理人：	郭德霞
地址：	100176 北京市大兴区经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种机器翻译质量评估方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种机器翻译质量评估方法、装置、设备和存储介质，应用于自然语言处理技术领域。该方法包括：获取待评估的翻译文本对，翻译文本对包括源语种对应的源文本和翻译后的目标语种对应的目标文本；基于至少两种质量评估指标和源文本，对目标文本进行质量评估，确定每种质量评估指标对应的评估结果；基于源语种与目标语种之间的语种相似度，确定每种质量评估指标对应的评估权重；基于各个评估权重，对各个评估结果进行融合处理，确定翻译文本对的目标评估结果。通过本发明实施例的技术方案，可以综合评估翻译质量，并且保证不同语种对的翻译评估准确度。

技术领域

本发明实施例涉及自然语言处理技术领域，尤其涉及一种机器翻译质量评估方法、装置、设备和存储介质。

背景技术

随着计算机技术的快速发展，往往需要对利用机器翻译模型翻译出的文本质量进行评估。

目前，可以基于翻译质量评估模型，对翻译后的文本进行质量评估。例如，基于句子级别标注数据进行训练获得的评估模型对翻译文本进行质量评估，获得的指标评估结果偏向于表征翻译文本的整体流畅度。或者，基于词级别标注数据进行训练获得的评估模型对翻译文本进行质量评估，获得的指标评估结果偏向于表征翻译文本的忠实度。

然而，在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

利用每种翻译质量评估模型获得的指标评估结果仅能偏向于评估翻译文本单一层面的质量情况，比如翻译文本的整体流畅度或者忠实度，无法综合评估出翻译质量，并且对不同语种对的翻译文本均采用相同的评估方式，进而导致不同语种对的翻译评估准确度差异较大的现象。

发明内容

本发明实施例提供了一种机器翻译质量评估方法、装置、设备和存储介质，以综合评估翻译质量，并且保证不同语种对的翻译评估准确度。

第一方面，本发明实施例提供了一种机器翻译质量评估方法，包括：

获取待评估的翻译文本对，所述翻译文本对包括源语种对应的源文本和翻译后的目标语种对应的目标文本；

基于至少两种质量评估指标和所述源文本，对所述目标文本进行质量评估，确定每种所述质量评估指标对应的评估结果；