[发明专利]上下文准确匹配无效
| 申请号: | 201010521841.9 | 申请日: | 2010-10-25 |
| 公开(公告)号: | CN102053958A | 公开(公告)日: | 2011-05-11 |
| 发明(设计)人: | 奥利弗·克里斯特;丹尼尔·布罗克曼 | 申请(专利权)人: | SDL有限公司 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;孙海龙 |
| 地址: | 英国*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 上下文 准确 匹配 | ||
技术领域
本发明一般地涉及内容处理,更具体地说,涉及确保与包含上下文的源内容的准确翻译匹配,以简化并方便翻译和其它与所述内容相关的处理功能。
背景技术
随着信息在全球范围内变得更加容易获得,尤其是互联网和万维网的到来和迅速利用,翻译的角色已改变而不再是将源文本简单地转换为目标语言。今天,翻译者必须确保将翻译的内容及时准确地分发到指定位置和消费者。这样,对内容翻译的增加的需求促使许多公司开发自动和在一定程度上有助于翻译过程的工具。假定翻译者需要尽快地翻译内容,软件功能的更加灵活和存储先前的翻译以备将来使用的能力将使得翻译更加有效地进行。因此,创建工具来将翻译,包括翻译块和/或片段,保存到计算机存储器(“翻译存储器”或“TM”)中。
翻译存储器(也被称作翻译数据库)是词条的集合,在各词条中,源文本与其对应的一种或多种目标语言翻译相关联。翻译存储器包括存储成对的源语言的文本片段和目标语言文本片段的数据库,可以在未来使用当前文本来检索目标翻译文本。TM通常在翻译工具中使用:当翻译者“打开”文本片段时,应用程序在数据库中查找等同的源文本。其结果是匹配列表,该匹配列表通常以表示文档中的源文本和TM中的源文本之间的相似度的值的分数进行排序。翻译者或不同的TM系统提供与查询的片段成对的目标文本片段,从而最终产品是高质量的翻译。
有许多可用于帮助翻译者的计算机辅助翻译(“CAT”)工具,例如双语和多语词典、语法书和拼写检查工具以及术语软件,但是TM更进一步,其通过使用这些其它的CAT工具同时通过准确匹配和模糊匹配将存储在数据库中的原始源文档与更新的或修改后的文档进行匹配。准确匹配(100%匹配)是指文档中的源文本和TM中的源文本之间的无差别(或没有不能被工具自动处理的差别)匹配。模糊匹配(小于100%的匹配)是指文档中的源文本与TM中的源文本非常相似但不完全一样的匹配。重复的准确匹配通常被当做是模糊匹配。TM系统被用作翻译者的辅助工具,在数据库中存储人工翻译者的文本以备将来使用。例如,当翻译者翻译原始文本时可使用TM,利用翻译存储器存储成对的源片段和目标片段。翻译者随后可再次使用存储的文本来翻译修改后的或更新后的版本的文本。仅那些与旧文本片段不匹配的新文本片段需要被翻译。另一种方案是使用手动翻译系统或不同的CAT系统来翻译原始文本。TM系统可随后被翻译者使用来翻译修改文本或更新文本,其方式是通过校准翻译者或其他CAT系统生成的文本然后将它们存储在TM数据库中以备当前和未来工作使用。如上所述,通过利用TM,翻译者随后可以仅进行新文本的段的翻译。
使用TM有许多优点:翻译可更加快速,避免已有翻译的不必要的重新键入和/或使翻译者能够仅改变文本的特定部分。TM还允许对翻译质量进行更好控制。在现有技术中,采用TM来在大批量项目中加速翻译步伐。例如,软件公司可发布其软件的版本1并需要翻译伴随的文档。所述文档被分成句子并被翻译,所有的句子对被TM俘获。两年以后所述公司发布其软件的版本2。所述文档被严重改变,但是还存在与原始文档相似的重要部分。此时,当翻译者翻译所述文档时,通过从TM中进行准确匹配和模糊匹配而减轻了它们的工作。像该实例显示的那样,TM通常在流水线工艺中被用作辅助工具。在现有技术中,在TM的使用中还有一些限制。
利用准确匹配的自动衍生翻译(不用验证)可产生不正确的翻译,这是由于没有将新片段所用于的上下文与原始片段所用于上下文进行比较验证:即真实再使用和再循环之间存在差别。在相关技术中,TM系统是再循环系统。通常的情况是,对文档(网页内容,现在有许多中内容)进行翻译,然后需要对该文档进行小的改变,然后需要再次翻译。例如,列出产品的优点的网页文档将被翻译,但是可增加新的优点并且所述文档因此需要被重新翻译。在相关技术中,TM将减轻第二次翻译所述文档的工作量。在源文本与TM中的一个或更多个词条相同的情况下可存在多数句子的准确匹配。随后翻译者通过评价与上下文信息的匹配的适度性来确保选择了正确的准确匹配。但是,相关技术不提供对内容的上下文的确定。此外,在现有技术中,并没有精确地选择针对给定片段的最佳准确匹配的自动过程或确认给定的准确匹配是否是给定片段将被应用的上下文的合适匹配的自动过程。这样,翻译者需要确认匹配。实际上,当仅几个单词发生改变时,翻译者需要针对每个句子确认并可能采取行动,假定在相关技术中,在不同的环境或上下文下一个片段需要被不同地翻译,则效率非常低。
鉴于以上所述,本领域需要精确确认给定的准确匹配是否是针对其将被应用到的上下文的合适匹配的自动过程。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SDL有限公司,未经SDL有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010521841.9/2.html,转载请声明来源钻瓜专利网。





