[发明专利]一种用于机器翻译的调序模型的生成方法和装置有效
申请号: | 201010600035.0 | 申请日: | 2010-12-13 |
公开(公告)号: | CN102053959A | 公开(公告)日: | 2011-05-11 |
发明(设计)人: | 吴华;胡晓光;王海峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种用于机器翻译的调序模型的生成方法,包括:获取双语语料库;对双语语料库中的源语言例句进行搭配抽取,以获取源语言搭配词对;对源语言例句以及目标语言例句进行双语词对齐,并根据双语词对齐结果确定源语言搭配词的对应译文;根据源语言搭配词在源语言例句中的顺序以及对应译文在目标语言例句的顺序确定源语言搭配词对的调序方向;对调序方向进行统计,获取每一调序方向的调序概率,以形成调序模型。通过上述方式,基于源语言的词与词之间的搭配信息建立调序模型,进而提高调序模型的调序能力。 | ||
搜索关键词: | 一种 用于 机器翻译 模型 生成 方法 装置 | ||
【主权项】:
一种用于机器翻译的调序模型的生成方法,其特征在于,所述生成方法包括以下步骤:a.获取双语语料库,所述双语语料库包括多个双语例句对,每一所述双语例句对包括源语言例句以及与所述源语言例句对应的目标语言例句;b.对所述源语言例句进行搭配抽取,以获取源语言搭配词对,每一所述源语言搭配词对包括两个具有搭配关系的源语言搭配词;c.对所述源语言例句以及所述目标语言例句进行双语词对齐,并根据双语词对齐结果确定所述源语言搭配词的对应译文;d.根据所述源语言搭配词在所述源语言例句中的顺序以及所述对应译文在所述目标语言例句的顺序确定所述源语言搭配词对的调序方向;e.对所述调序方向进行统计,获取每一所述调序方向的调序概率,以形成调序模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010600035.0/,转载请声明来源钻瓜专利网。