[发明专利]辅助翻译方法在审
申请号: | 202111155095.0 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113947094A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 李光华;张娜 | 申请(专利权)人: | 甲骨易(北京)语言科技股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/49 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 赵敏 |
地址: | 101399 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 翻译 方法 | ||
本发明提供了一种融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法,包括:第一步骤:将译者上传的可编辑文档以句为单位解析和拆分为独立句段;第二步骤:将独立句段与记忆库和术语库进行关联,同时批量抽取记忆库片段,以融合到交互式翻译环节给译员的推荐译文中第三步骤:将解析后的独立句段中的文档展示为可在浏览器预览和编辑的HTML格式,同时对解析后的独立句段中的句对进一步作分词,用于术语库匹配;第四步骤:将解析后的句段和分词结果在关联的记忆库和/或术语库中进行匹配,并且将满足预定条件的句子进行标记;第五步骤:机器翻译引擎返回译文。
技术领域
本发明涉及一种融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法。
背景技术
神经网络机器翻译使得自动翻译译文对译者有较大参考意义,目前市场上较为流行的翻译方式是译后编辑模式(第一类方案)——即让译者直接修改自动翻译的译文。还有一类方案是基于译者输入片段重新解码生成译文的交互式翻译(第二类方案),机器根据译者输入实时推荐译文,不提供记忆库片段/术语库融合、以及编辑器预览。
第一类方案的缺点是机翻译文直接占据译文输入框,限制了译者翻译思路,容易误导译员,导致译员只对机器翻译结果作小修小补,且译者修改的内容无法实现机器模型增量学习。第二类方案的缺点是没有融合译者记忆库片段和术语库、以及全文预览信息,在交互式翻译提示时,仅提供基于机器翻译的推荐译文,不能融合当前句段对应的记忆库片段和术语实时推荐译文,导致推荐准确度不高,对译者效率提升有限。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法,旨在通过融合译者输入、记忆库片段/术语库,以及实时预览的方式,提升译者翻译效率。
根据本发明,提供了一种融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法包括:
第一步骤:将译者上传的可编辑文档以句为单位解析和拆分为独立句段;
第二步骤:将独立句段与记忆库和术语库进行关联;同时批量抽取记忆库片段,以融合到交互式翻译环节给译员的推荐译文中;
第三步骤:将解析后的独立句段中的文档展示为可在浏览器预览和编辑的HTML格式,同时对解析后的独立句段中的句对进一步作分词,用于术语库匹配;
第四步骤:将解析后的句段和分词结果在关联的记忆库和/或术语库中进行匹配,并且将满足预定条件的句子进行标记,并传递给机器翻译引擎;
第五步骤:机器翻译引擎返回译文。
优选地,第五步骤将译文和原文展示在编辑器,供译者预览和翻译。
优选地,所述融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法还包括:
第六步骤:按照译者光标位置,逐句匹配记忆库和术语库结果,将满足预定条件的匹配结果发送给机器翻译引擎。
优选地,所述融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法还包括:
第七步骤:获取译者输入片段,以及相应的记忆库片段和术语,用于干预机器翻译解码结果,将机翻重新翻译的结果返回给译员。
第八步骤:译员确定该句译文后,将该句确认后的术语和记忆库片段实时存储,用于后续机器翻译引擎输入结果干预。
第九步骤:定期将译员确认的原文和译文用于机器翻译模型增量学习。
优选地,所述融合译者输入、记忆库片段/术语库及实时预览的辅助翻译方法还包括:机器翻译引擎根据收集的原文和译文进行增量学习,并更新机器翻译引擎,以便下次输出质量更佳的译文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨易(北京)语言科技股份有限公司,未经甲骨易(北京)语言科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111155095.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于移动闭塞的列车筛选方法及装置
- 下一篇:交叉口移位左转的优化方法