[发明专利]文档批量翻译方法、装置、电子设备及存储介质在审
申请号: | 202110126066.5 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112784613A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 张芃 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/216;G06F16/35 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈新生 |
地址: | 430206 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 批量 翻译 方法 装置 电子设备 存储 介质 | ||
本发明涉及计算机技术领域,提供了一种文档批量翻译方法、装置、电子设备及存储介质,其中方法包括:确定待翻译的多个文档;基于任一文档的文档结构对所述任一文档进行分解,确定所述任一文档对应的翻译任务块;对各个文档对应的翻译任务块进行聚合,确定所述多个文档对应的翻译任务包;基于所述多个文档对应的翻译任务包,确定所述多个文档的翻译结果。本发明提供的方法、装置、电子设备及存储介质,实现了对多个文档的批量翻译,提高了文档翻译效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文档批量翻译方法、装置、电子设备及存储介质。
背景技术
在大型文档翻译项目中,通常将多篇待翻译文档分配给多个译员进行并行翻译,以快速准确地得到翻译结果。现有技术中,分配待翻译文档时主要依靠人工方式分配,使得文档分配不合理,翻译时间长,翻译效率低,并且翻译结果的准确性差。
发明内容
本发明提供一种文档批量翻译方法、装置、电子设备及存储介质,用以解决现有技术中文档分配不合理,翻译时间长,翻译效率低的技术问题。
本发明提供一种文档批量翻译方法,包括:
确定待翻译的多个文档;
基于任一文档的文档结构对所述任一文档进行分解,确定所述任一文档对应的翻译任务块;
对各个文档对应的翻译任务块进行聚合,确定所述多个文档对应的翻译任务包;
基于所述多个文档对应的翻译任务包,确定所述多个文档的翻译结果。
根据本发明提供的一种文档批量翻译方法,所述基于任一文档的文档结构对所述任一文档进行分解,确定所述任一文档对应的翻译任务块,包括:
对所述任一文档进行片段划分,确定所述任一文档的所有片段;
基于所述任一文档的文档结构,以及所述任一文档的所有片段,确定所述任一文档中每一层级对应的若干个连续片段;
基于翻译任务块的字数范围,以及所述任一文档中每一层级对应的若干个连续片段,确定所述任一文档对应的翻译任务块。
根据本发明提供的一种文档批量翻译方法,所述对各个文档对应的翻译任务块进行聚合,确定所述多个文档对应的翻译任务包,包括:
基于翻译任务块之间的语义相似度,对各个文档对应的翻译任务块进行聚类,得到多个语义相似类;
基于任一语义相似类中各个翻译任务块之间的语义相似度,以及各个翻译任务块的字数,对所述任一语义相似类中各个翻译任务块进行聚合,得到所述任一语义相似类对应的翻译任务包;
基于每一语义相似类对应的翻译任务包,确定所述多个文档对应的翻译任务包。
根据本发明提供的一种文档批量翻译方法,所述基于翻译任务块之间的语义相似度,对各个文档对应的翻译任务块进行聚类,得到多个语义相似类,包括:
将所有只包含一个翻译任务块的语义相似类进行合并。
根据本发明提供的一种文档批量翻译方法,所述基于任一语义相似类中各个翻译任务块之间的语义相似度,以及各个翻译任务块的字数,对所述任一语义相似类中各个翻译任务块进行聚合,得到所述任一语义相似类对应的翻译任务包,包括:
以所述任一语义相似类中各个翻译任务块为顶点建立无向图;所述无向图中的边为各个翻译任务块之间的语义相似度,所述无向图中的顶点权重为各个翻译任务块的字数;
以边优先对所述无向图进行遍历,将顶点权重和满足预设条件的多个顶点对应的任务翻译块聚合为一个翻译任务包,直至得到所述任一语义相似类对应的翻译任务包;所述预设条件为顶点权重和在翻译任务包的字数范围之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110126066.5/2.html,转载请声明来源钻瓜专利网。