[发明专利]机器翻译装置、方法及程序无效
申请号: | 201310463708.6 | 申请日: | 2013-10-08 |
公开(公告)号: | CN103729347A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 田中浩之 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘瑞东;陈海红 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 装置 方法 程序 | ||
技术领域
本发明的实施方式涉及将第1语言翻译为第2语言的机器翻译装置、方法及程序。
背景技术
近年,伴随计算机的高性能化、宽带基础设施的迅速普及,将第1语言的原文翻译为第2语言的译文的大量机器翻译装置及机器翻译业务得到普及。一般地说,机器翻译中,按第1语言的单词及第1原词的节单位保持多个第2语言的译词候选。这样的机器翻译中,根据输入的原文,考虑原文侧的语句和译文侧的语句的意思同一性和译文流畅性来选择适当的译词是重要的。
作为选择适当的译词的方法,有统计库翻译方式,但是必须准备大规模的对译语料库。作为不需要这样的大规模对译语料库而考虑意思的同一性的方法,例如有采用原文侧的语句和译文侧的语句的各自的共现(co-occurrence)词的方法。
专利文献1:日本特开2002-351872号公报
发明内容
但是,上述方法中,必须准备原文及译文的双方的共现词列表,而且仅仅以共现为线索,因此未考虑全文的流畅性,无法选择流畅性高的译词。
本发明为了解决上述的问题而提出,目的是提供可生成流畅性高的译文的机器翻译装置、方法及程序。
本实施方式的机器翻译装置包括翻译部、译词候选取得部、流畅度计算部、逆向翻译部、类似度计算部及译词选择部。翻译部将第1语言的字符串即原文翻译为第2语言的字符串即译文。译词候选取得部对于与上述译文中的第1译词对应的上述原文中的原词,取得作为该原词的翻译的不同于该第1译词的一个以上的第2译词,将该第1译词及该第2译词作为译词候选。流畅度计算部按每个译词候选,计算表示在上述译文中的上述第1译词的插入位置插入上述译词候选时生成自然译文的合适度的流畅度。逆向翻译部按每个译词候选,获得上述译词候选向上述第1语言的逆向翻译结果即一个以上的逆向翻译词。类似度计算部按每个逆向翻译词,计算上述原词和上述逆向翻译词在上述第1语言中的意思的类似度。译词选择部根据上述类似度和上述流畅度,从上述译词候选选择用于置换上述第1译词的校正译词。
附图说明
图1是第1实施方式的机器翻译装置的方框图。
图2是在翻译词典数据库存储的表的一例的示图。
图3是在流畅度数据库存储的一例的示图。
图4是机器翻译装置的工作的流程图。
图5是机器翻译装置的译词选择处理的流程图。
图6是取得部取得的原文的一例的示图。
图7是翻译部生成的译文的一例的示图。
图8是译词候选取得部中的译词候选的提取结果的一例的示图。
图9是第1实施方式中的流畅度计算部的流畅度的计算结果的一例示图。
图10是第1实施方式中的逆向翻译部的逆向翻译结果的一例示图。
图11是第1实施方式中的类似度计算部的类似度的计算结果的一例示图。
图12是第1实施方式中的译词选择部的判定得分的一例示图。
图13是第2实施方式的机器翻译装置的方框图。
图14是第2实施方式中的流畅度计算部的流畅度的计算结果的一例示图。
图15是第2实施方式中的逆向翻译部的逆向翻译结果的一例示图。
图16是第2实施方式中的类似度计算部的类似度的计算结果的一例示图。
图17是第2实施方式中的译词选择部的判定得分的一例示图。
标号说明:
100,1300…机器翻译装置,101…取得部,102…翻译部,103…译词候选取得部,104…流畅度计算部,105…逆向翻译部,106…类似度计算部,107…译词选择部,108…输出部,109…翻译词典数据库,110…流畅度数据库,111…类似度数据库,200…翻译词典,201…原词,201…原文,202…译词,300,800,900,1000,1100,1200…表,301…前出字,302…后出字,303…译词,304,901…流畅度,801…译词候选,1001…逆向翻译词,1101…类似度,1201…判定得分,1301…译词候选取得部。
具体实施方式
以下,参照附图,详细说明本实施方式的机器翻译装置、方法及程序。另外,以下的实施方式中,附上同一参照符号的部分进行同样的工作,重复的说明适宜省略。
本实施方式中,以作为原文的第1语言是英语,作为译文的第2语言是日语的场合为例进行说明,但是,翻译处理的对象语言不限于这2种语言,可以以全部语言为对象。另外,以下,将从第2语言到第1原词的翻译称为逆向翻译。
(第1实施方式)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310463708.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种隧道施工衬砌量确定装置
- 下一篇:一种隧道脱模衬砌装置