[发明专利]基于层次短语模型的译文词序概率确定方法及装置有效
申请号: | 201110379623.0 | 申请日: | 2011-11-16 |
公开(公告)号: | CN103116575A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 郑仲光;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 短语 模型 译文 词序 概率 确定 方法 装置 | ||
1.一种基于层次短语模型的译文词序概率确定方法,包括:
确定源语句的候选翻译模式;
针对每一候选翻译模式提取用于表征词序概率的特征量;
根据预先获得的模型训练结果确定所述特征量的词序概率;
根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;
根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。
2.根据权利要求1所述的方法,其中,所述针对每一候选翻译模式提取用于表征词序概率的特征量,包括:
针对每一候选翻译模式提取满足第一约束条件的用于表征词序概率的特征量。
3.根据权利要求1所述的方法,其中,所述模型训练结果通过以下方式获得:
从训练语句中提取用于表征词序概率的特征量;
根据提取的特征量进行最大似然估计,获得所述训练语句中各特征量的词序概率;
将所述训练语句中的各特征量及其词序概率作为模型训练结果。
4.根据权利要求3所述的方法,其中,所述从训练语句中提取用于表征词序概率的特征量,包括:
从训练语句中提取满足第二约束条件的用于表征词序概率的特征量。
5.根据权利要求1所述的方法,其中,所述根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率,包括:
计算每一候选翻译模式中各特征量的词序概率的连乘,并将连乘结果作为各候选翻译模式的词序概率。
6.根据权利要求1所述的方法,其中,所述根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率,包括:
当所述候选翻译模式中还包含未知译文时,将所述候选翻译模式中词序概率的最大值作为初始概率;
计算所述未知译文的修正概率;
采用所述修正概率对所述初始概率中包含所述未知译文的特征量的词序概率部分进行修正,将修正后的初始概率作为所述源语句的译文词序概率。
7.根据权利要求6所述的方法,其中,所述计算所述未知译文的修正概率,包括:
确定未知译文的候选翻译模式;
针对每一候选翻译模式提取用于表征词序概率的特征量;
根据预先获得的模型训练结果确定所述特征量的词序概率;
根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;
根据所述候选翻译模式中词序概率的最大值,确定所述未知译文的译文词序概率;
将所确定的译文词序概率的最大值所对应的未知译文的候选翻译模式扩展至所述初始概率对应的源语句的候选翻译模式中,计算包含所述未知译文的特征量的词序概率部分,记为扩展后的词序概率;
将所述未知译文的词序概率与所述扩展后的词序概率的和作为修正概率。
8.根据权利要求1至7中任意一项所述的方法,其中,所述方法还包括:
根据所述源语句的译文词序概率及其权重,确定所述源语句的译文正确率。
9.一种基于层次短语模型的译文词序概率确定装置,包括:
第一确定单元,配置为确定源语句的候选翻译模式;
特征量提取单元,配置为针对每一候选翻译模式提取用于表征词序概率的特征量;
第二确定单元,配置为根据预先获得的模型训练结果确定所述特征量的词序概率;
第三确定单元,配置为根据所述特征量的词序概率,确定所述每一候选翻译模式的词序概率;
概率确定单元,配置为根据所述候选翻译模式中词序概率的最大值,确定所述源语句的译文词序概率。
10.根据权利要求9所述的装置,其中,所述装置还包括模型训练单元,所述模型训练单元包括:
提取子单元,配置为从训练语句中提取用于表征词序概率的特征量;
计算子单元,配置为根据提取的特征量进行最大似然估计,获得所述训练语句中各特征量的词序概率;
确定子单元,配置为将所述训练语句中的各特征量及其词序概率作为模型训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110379623.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动旋盖封口装置
- 下一篇:遥控吊车的驱动系统