[发明专利]一种用于提升翻译准确性的方法、系统及装置在审
申请号: | 202110745049.X | 申请日: | 2021-07-01 |
公开(公告)号: | CN113420570A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 郝顺平;关祎宁 | 申请(专利权)人: | 沈阳创思佳业科技有限公司 |
主分类号: | G06F40/51 | 分类号: | G06F40/51;G06F40/289;G06F40/126 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 李娜 |
地址: | 110000 辽宁省沈阳市皇姑区昆山西*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 提升 翻译 准确性 方法 系统 装置 | ||
本发明公开一种用于提升翻译准确性的方法、系统及装置,本发明通过将输入原文的单词数组与翻译记忆库存储的原文数组转换为两个数字数组,这样在逐一比较单词的时候,只需要比较数字即可,缩减了比较次数,避免了每次的字符转码,并且计算机处理数字的速度要比文本快,提升了原文内容的比较速度,进而直接提升了匹配算法的性能和计算速度,同时对于翻译记忆库里的原文,可以采用每次存储之前先按本发明转换为数字后再进行存储的办法,在下次匹配直接比较已存储好的单词数组,可以减少转换开销,进一步提升性能。
技术领域
本发明涉及智能翻译领域,具体涉及一种用于提升翻译准确性的方法、系统及装置。
背景技术
翻译记忆库是翻译领域中比较常用到的翻译辅助软件,不断收集和存储翻译项目中已被审核的无质量缺陷的原文和译文,并且提供一种匹配算法,从存储的原文里对需要翻译的输入原文进行相似度匹配,最终返回翻译记忆库中相似度较高的一批原文以及对应的译文。由于这些译文都是经过审核的,所以可以为译员提供高质量的译法参考。
综上所述,影响一个翻译记忆库匹配性能的关键环节是原文的存储以及匹配算法。原文内容作为匹配算法的基础和依据,同时直接决定了匹配算法的计算性能,主要体现在对原文的比较速度方面。随着翻译记忆库的存储量随着翻译业务逐渐累积,系统在比较原文时的开销将随之增加,因此对原文内容的处理和数据类型的设计,是影响翻译记忆库匹配性能的重要环节。
传统的原文处理方法,是将整句原文内容按字符串类型存储到翻译记忆库中,发生匹配时,先将原文从库中取出进行分词,再将输入原文分词,将两个分词后的单词文本数组,通过匹配算法,计算出这两句原文的相似度,最终得出翻译记忆库中相似度最高的那条数据。
这种按文本进行匹配的方式,在比较原文中每个单词的时候可能会带来性能上的问题。首先计算机处理字符串的原理是先将每个字符转为ASCII码后,再逐一处理比较每个ASCII码值,这样对于一单词字符串来说,字符越多,比较的次数也就越多,如果单词个数也很多,匹配算法就可能非常慢。当翻译记忆库数据随着翻译业务的增多,参考原文数量和原文的单词个数增多,这种性能问题会更加明显。增加了译员等待参考译文的时间,降低了翻译效率。
发明内容
由于按文本方式匹配原文,获得对应参考译文的做法,会随着翻译记忆库内容的逐渐累加而影响计算性能,降低翻译效率,本发明为了解决这一技术问题,公开了一种原文处理方法,通过对原文存储方式和数据结构的优化,提升翻译记忆库的整体匹配性能;
本发明提供了一种用于提升翻译准确性的方法,包括以下步骤,
采集无质量缺陷的第一翻译资料的第一单词以及第一单词对应的第二单词,对第一单词、第二单词分别进行二进制转换,获得第一单词的第一数字表达式以及第二单词的第二数字表达式,其中,第一单词为第一翻译资料的原文单词,第二单词为第一翻译资料的译文单词;
采集待翻译文献资料,对待翻译文献资料进行二进制转换,获得待翻译文献资料的第三数字表达式,通过比较第三数字表达式与第一数字表达式或第二数字表达式的第一相似度,获得待翻译文献资料的第二翻译资料。
优选地,采集第三翻译资料,对第三翻译资料进行二进制转换,获得第三翻译资料的第四数字表达式,通过比较第四数字表达式与第一数字表达式或第二数字表达式的第二相似度,获得第三翻译资料的翻译准确度,其中,第三翻译资料为已翻译好待校对的文献资料。
优选地,基于翻译准确度,获得第一单词或第二单词,并将第一单词或第二单词添加到第三翻译资料中,其中,在将第一单词或第二单词添加到第三翻译资料中的过程中,标注第一单词或第二单词,标注的形式至少包括,单词字体、单词字号、单词颜色、对话框。
优选地,在对第一单词、第二单词、待翻译文献资料、第三翻译资料分别进行二进制转化的过程中,
采集待转化单词的单词长度,通过四位二进制进行表达,获得第一表达式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳创思佳业科技有限公司,未经沈阳创思佳业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110745049.X/2.html,转载请声明来源钻瓜专利网。