[发明专利]分布式智能翻译方法无效

专利信息
申请号: 201210085307.7 申请日: 2012-03-28
公开(公告)号: CN102662933A 公开(公告)日: 2012-09-12
发明(设计)人: 张马成;王兴强;伍华;杨明;王小龙 申请(专利权)人: 成都优译信息技术有限公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/27;G06F17/30
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 谢敏
地址: 610041 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 智能 翻译 方法
【说明书】:

技术领域

发明涉及翻译方法,具体涉及一种分布式智能翻译方法。

背景技术

CAT软件发展到今天,已经形成了翻译、记忆、存储等不同的技术原理。就记忆数据库来讲,一般的翻译软件在翻译时,是将单个一行的字、词或者句与译文作为一个语言对存入数据库,并且这个存入的数据只作为安装翻译软件的本机器在翻译后续内容时使用,在翻译另外一篇文章时,如果上一篇文章的记忆内容未导出,在翻译下一篇文章时又未导入上一篇的记忆内容,这样是无法共享之前翻译过的记忆内容。这种在本地生成数据的方法,操作起来就比较繁琐,再加上记忆库无法在一个项目的过程中被实时使用,这样使得翻译效率非常低。

随着对翻译产量和质量要求的提高,对翻译软件有更高的要求,准确、快速完成对一篇文章的翻译要求更智能化的翻译软件来提高翻译产量和质量。针对一个项目来说,现有翻译技术,针对翻译质量不高,同一篇翻译文章在一个团队中分为几份翻译,翻译中会出现不同译员翻译相同的含义的一句话而翻译的译文不一致,翻译团队难以共享记忆数据库中的信息,并且在翻译过程中,未智能记忆整个翻译信息。在专有词汇及其准确性上,现有分词算法有可能造成无法匹配对一句中出现的专有词汇,从而造成翻译文章的准确性大大降低。

同时,现有的翻译软件,有以下几大缺点:1.专有词汇库(短语)缺乏以及不专业;2.翻译效率低;3.没有项目协同工作功能,翻译过程中整个翻译团队无法实时共享翻译中的翻译信息;4.翻译项目无实时智能学习整个翻译过程。

 

发明内容

本发明克服了现有技术的不足,提供一种分布式智能翻译方法,该方法主要提供了比较专业的翻译词汇库,提高了翻译过程中的翻译效率和翻译速度,解决了现有技术中存在的技术问题。

本发明采用以下技术方案:

一种分布式智能翻译方法,包括如下步骤:

步骤1,在客户端导入需要翻译的原文,对原文进行分析,将原文划分成最大的识别单元——段;

步骤2,对每一段按句进行拆分;

步骤3,将每一句与数据库中的数据进行查找 ,上述的数据库分为位于客户端的本地数据库和位于服务器端的后台数据库,而后台数据库又分为静态数据库和动态数据库,查询匹配时都先查询本地数据库,若找到句的匹配则直接进入步骤5,如果没查到,再查静态数据库,静态数据库查到了则也直接进入步骤5,在静态数据库没有查到的情况下,最后查询动态数据库若找到句的匹配也直接进入步骤5,若没找到则进入步骤4;

步骤4,将句再按照相邻字1至N个字进行组合,再将组合后的多个词组及单个最小单位的词组都先与本地数据库的数据进行匹配查找;若查到则进步骤5,若没查到,则与和静态数据库中的数据进行匹配查找;若查到则进步骤5,若没查到,则与动态数据库中的数据进行匹配查找;

步骤5,查询到结果后,实时返回用户界面供用户选择,同时将翻译的原文和译文记录到本地数据库和动态数据库中,以供以后翻译时使用;

步骤6,将组合查询后的结果记录在客户端的内存中,并且在原文处以标注的方式,将查询出来的结果明显的表现出来,当需要使用时,鼠标点击此处会将译文立刻显示在用户界面供选择,再次点击译文后会立刻将译文显示在译文行。

更进一步的是:

上述的本地数据库位于每个客户端,按每一句记录译员自己翻译的原文、译文信息,译员每翻译一句的原文、译文都添加到此本地数据库和服务器端的动态数据库中。

上述的步骤4中将句再按照相邻一字至相邻N个字进行组合,是指将含有N个字的句子按如下步骤进行组合拆分:

步骤4-1:将第一个字和第二个字、第一、第二和第三个字、第一、第二、第三和第四个字直至第一、第二……和第N—1个字进行组合拆分成多种结果;

步骤4-2:将第二字与第三个字,第二、第三和第四个字,第二、第三、第四和第五个字,直至第二、第三、第四……和第N个字进行组合拆分成多种结果;

步骤4-3:将第三字与第四个字,第三、第四和第五个字,第三、第四、第五和第六个字,直至第三、第四……和第N个字进行组合拆分成多种结果;

并以此类推直至步骤4—N-1。

上述的静态数据库存入的数据由专有词汇组成,而动态数据库中的数据则为多个客户端实时翻译时记录的信息之和,包括了词汇和句子。

上述的步骤1中是通过段与段之间的回车换行符作为标记,将每段话拆分开来。

上述的步骤2中是将句末标点符号作为标记,将每句话拆分开来。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术有限公司,未经成都优译信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210085307.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top