[发明专利]维吾尔语词干提取方法无效
申请号: | 201210579424.9 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103902522A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 尼加提·纳吉米;买合木提·买买提;帕肉克·司地克;马斌 | 申请(专利权)人: | 新疆电力信息通信有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 乌鲁木齐新科联知识产权代理有限公司 65107 | 代理人: | 祁磊 |
地址: | 830011 新疆维吾*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了维吾尔语词干提取方法,根据维吾尔语的形态特点对维吾尔语词干提取规则形式化,依据维吾尔语名词形态构造构形词缀优先自动机、形容词、数词、量词、代词、副词等静词的有限状态自动机(FSM),对动词的词干、人称形式、非人称形式等构建了范畴级别的相互连接或出现规则框架,针对每一个范畴根据范畴的形态变化规律分别使用了简单的线性规则或FSM。本发明为汉维机器翻译和维吾尔语电子词典的构建提供了帮助,对乌(乌孜别克文)、哈(哈萨克)、柯(柯尔克孜)、土(土耳其文)电子词典及辅助机器翻译系统的开发打下了坚实的基础。 | ||
搜索关键词: | 维吾尔 语词 提取 方法 | ||
【主权项】:
一种维吾尔语词干提取方法,其特征是:1. 构造名词构形词缀优先自动机,确定所有构形名词词缀和它们间的连接规则,然后构造从左向右的维吾尔语名词构形词缀切分有限自动机;2. 构造形容词有限状态自动机,和名词构建过程一样构造形容词的有限状态自动机;3. 构造数词有限状态自动机;4.使用统计学和语音学实现维文单词和文本的朗读功;5.对动词的词干、人称形式、非人称形式构建范畴级别的相互连接或出现规则框架,针对每一个范畴根据范畴的形态变化规律分别使用简单的线性规则或FSM,对助动词、系动词根据内部分类把形态有较多变化的与动词一样处理,对形态变化也十分有限的部分系动词和助动词的采用词典的方法进行处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆电力信息通信有限责任公司,未经新疆电力信息通信有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210579424.9/,转载请声明来源钻瓜专利网。
- 上一篇:结合词性的英语近形词干扰项生成方法
- 下一篇:金属线材表面清洁设备