[发明专利]藏汉翻译系统的多策略藏语长句切分方法有效
申请号: | 201410458322.0 | 申请日: | 2014-09-10 |
公开(公告)号: | CN104239294B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 黄河燕;黄静 | 申请(专利权)人: | 华建宇通科技(北京)有限责任公司;北京理工大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京北新智诚知识产权代理有限公司11100 | 代理人: | 满靖 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于藏汉翻译系统的、对复杂藏语长句进行快速、准确切分的多策略藏语长句切分方法,它包括接收藏语长句,对每一成分逐个判断,若成分为数字或特殊符号、逗号但无源文模式匹配成功且模式条件满足的逗号切分实例、单词但在特征词索引表中检索不到,或者检索到然而无源文模式匹配成功且模式条件满足的特征词切分实例,则继续判断下一成分,否则记录切分点,切分点之前成分作为切分子句送出,继续判断余下第一个成分。在判断各成分之前先要判断指针当前是否指向空,若是则将余下成分送出结束,否则读取指针当前指向的成分。 | ||
搜索关键词: | 翻译 系统 策略 藏语 长句 切分 方法 | ||
【主权项】:
一种藏汉翻译系统的多策略藏语长句切分方法,其特征在于,它包括如下步骤:1)接收由转写系统转换的藏语长句,设当前长句由若干成分构成,令指针指向第一个成分,成分为一单词或一数字或一逗号或一特殊符号;2)判断指针是否指向空:若是,将当前剩余成分作为切分子句送出,结束;否则,读取指针指向的成分;3)判断该成分是否为数字或特殊符号:若不是,继续4);否则,指针指向下一成分,返回2);4)判断该成分是否为逗号:若不是,继续5);否则,取出逗号切分实例的源文模式和模式条件:若源文模式匹配成功且模式条件满足,记录切分点,将切分点之前的所有成分作为切分子句送出,指针指向切分点之后的第一个成分,返回2);否则,指针指向下一成分,返回2);5)在特征词索引表中检索该成分:若检索到,继续6);否则,指针指向下一成分,返回2);6)在特征词切分实例表中逐一取出该成分对应的各特征词切分实例:若找到源文模式匹配成功且模式条件满足的特征词切分实例,记录切分点,将切分点之前的所有成分作为切分子句送出,指针指向切分点之后的第一个成分,返回2);否则,指针指向下一成分,返回2);其中:逗号切分规则实例库用于存储逗号切分实例,逗号切分实例包括一源文模式和一模式条件;特征词切分规则实例库用于存储特征词索引表、特征词切分实例表,特征词索引表用于存储特征词,特征词切分实例表用于存储特征词切分实例,每一特征词对应有至少一特征词切分实例,每一特征词切分实例包括一源文模式和一模式条件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华建宇通科技(北京)有限责任公司;北京理工大学,未经华建宇通科技(北京)有限责任公司;北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410458322.0/,转载请声明来源钻瓜专利网。