[发明专利]生成单语解析模型的方法和装置以及语言转换装置有效
申请号: | 201310491909.7 | 申请日: | 2013-10-18 |
公开(公告)号: | CN104572629A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 付亦雯;郑仲光;葛乃晟;孟遥;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;王娜丽 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种生成单语解析模型的方法和装置以及语言转换装置。生成单语解析模型的方法包括:按照双语平行语料中的以目标语言撰写的目标语句的语序来调整双语平行语料中的以源语言撰写的源语句的语序;按照以下助词在目标语句中的位置将该助词插入调整了语序的源语句中以得到作为参考的中间语句,其中,在目标语句中存在该助词而在源语句中没有与该助词对应的助词;根据目标语言和源语言的双语平行语料,利用源语句与目标语句之间的空对齐信息以预定策略生成用于调整源语句的语序的候选结构表示;根据作为参考的中间语句从所生成的候选结构表示中选择用于生成单语解析模型的结构表示;以及对所选择的结构表示进行建模以生成单语解析模型。 | ||
搜索关键词: | 生成 解析 模型 方法 装置 以及 语言 转换 | ||
【主权项】:
一种生成单语解析模型的方法,包括:按照双语平行语料中的以目标语言撰写的目标语句的语序来调整所述双语平行语料中的以源语言撰写的源语句的语序;按照以下助词在所述目标语句中的位置将该助词插入调整了语序的源语句中以得到作为参考的中间语句,其中,在所述目标语句中存在该助词而在所述源语句中没有与该助词对应的助词;根据目标语言和源语言的双语平行语料,利用所述源语句与所述目标语句之间的空对齐信息以预定策略生成用于调整所述源语句的语序的候选结构表示,其中,所述预定策略包括:以第一预定概率(PR)在所述候选结构表示的非端部节点处标记表示要调换所述候选结构表示的两个相邻分枝的顺序的标记(R),以及以第二预定概率(PI)在所述候选结构表示的节点处标记表示要插入助词的标记(I);根据所述作为参考的中间语句从所生成的候选结构表示中选择用于生成单语解析模型的结构表示;以及对所选择的结构表示进行建模以生成所述单语解析模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社;,未经富士通株式会社;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310491909.7/,转载请声明来源钻瓜专利网。