[发明专利]基于层次短语模型的译文词序概率确定方法及装置有效
申请号: | 201110379623.0 | 申请日: | 2011-11-16 |
公开(公告)号: | CN103116575A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 郑仲光;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 短语 模型 译文 词序 概率 确定 方法 装置 | ||
技术领域
本发明一般地涉及数据处理的技术领域,尤其是一种基于层次短语模型的译文词序概率确定方法及装置。
背景技术
层次短语模型(Hierarchical Phrase-based Model)是在将源语言转换为目标语言的数据处理过程中比较成熟的模型,该模型具有良好的短语调序能力,性能要好于传统的基于短语的模型(Phrase-based Model)。层次短语模型使用的翻译模式主要包括两种:包含非终结符X的模式和不包含X的模式。层次短语模型通过非终结符来扩展译文,通过源语言与目标语言之间的词对应关系来调序。
如图1所示,演示了一实例中层次短语模型的转换过程,例如,翻译过程,通过层次短语模型的一翻译模式,交换X1、X2的位置起到了调序的作用,从而得到了正确的源语言与目标语言之间的转换结果,在该例中即为翻译结果。
虽然层次短语模型有着很强的调序能力,但是现有的翻译过程中,由于该模型缺少对调序过程的控制,无法获得源语句的译文词序概率,容易导致翻译模式选择错误,进而造成一些调序错误频繁地出现。如图2所示,源语言本该使用模式<X1氨水溶液X2,X1 ammonia solution X2>按顺序翻译,由于选择了错误的翻译模式<X1氨水溶液X2,X2 X1ammonia solution>,将X2调序到最前面,导致翻译结果错误。
发明内容
有鉴于此,本发明实施例提供了一种基于层次短语模型的译文词序概率确定方法及装置,能够获得源语句的译文词序概率,进而可以增加翻译模式选择的正确性,提高从源语言到目标语言的转换过程的正确率,由此改善数据处理性能。
根据本发明实施例的一个方面,提供一种基于层次短语模型的译文词序概率确定方法,包括:
确定源语句的候选翻译模式;
针对每一候选翻译模式提取用于表征词序概率的特征量;
根据预先获得的模型训练结果确定所述特征量的词序概率;
根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;
根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。
根据本发明实施例的再一个方面,提供一种基于层次短语模型的译文词序概率确定装置,包括:
第一确定单元,配置为确定源语句的候选翻译模式;
特征量提取单元,配置为针对每一候选翻译模式提取用于表征词序概率的特征量;
第二确定单元,配置为根据预先获得的模型训练结果确定所述特征量的词序概率;
第三确定单元,配置为根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;
概率确定单元,配置为根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述基于层次短语模型的译文词序概率确定方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述基于层次短语模型的译文词序概率确定方法。
根据本发明实施例的上述方法,通过在候选翻译模式中提取表征词序概率的特征量,进而确定源语句的译文词序概率,增加对调序过程的控制,提高了翻译模式选择的正确性,减少了调序错误的出现,从而提升源语句与目标语句之间进行转换这种数据处理过程的正确率,改善数据处理性能。
在下面的说明书部分中给出本发明实施例的其他方面,其中,详细说明用于充分地公开本发明实施例的优选实施例,而不对其施加限定。
附图说明
下面结合具体的实施例,并参照附图,对本发明实施例的上述和其它目的和优点做进一步的描述。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出现有技术中基于层次短语模型的翻译过程示意图;
图2是示出现有技术中翻译模式选择错误的示意图;
图3是示出作为本发明实施例提供的一种基于层次短语模型的译文词序概率确定方法的流程图;
图4是示出作为本发明实施例提供的一源语句的候选翻译模式示意图;
图5是示出作为本发明实施例提供一个翻译对的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110379623.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动旋盖封口装置
- 下一篇:遥控吊车的驱动系统