[发明专利]维吾尔语句子相似度计算方法无效
申请号: | 201210579445.0 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103902523A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 尼加提·纳吉米;买合木提·买买提;帕肉克·司地克;马斌 | 申请(专利权)人: | 新疆电力信息通信有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 乌鲁木齐新科联知识产权代理有限公司 65107 | 代理人: | 祁磊 |
地址: | 830011 新疆维吾*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了维吾尔语句子相似度计算方法,1.建立维吾尔语倒排索引的;2.对输入维吾尔语句子进行粗选;3.计算基于词的维吾尔语句子相似度;4.计算维吾尔语简单结构相似度;5.计算维吾尔语句子综合相似度。本发明实现了维吾尔语句子相似度计算功能,为基于实例的维吾尔语汉语机器翻译系统提供了帮助;为维吾尔语文本分类系统、维吾尔语问答系统、维吾尔语摘要自动生成系统、维吾尔语搜索引擎等系统的开发打下了坚实的基础。 | ||
搜索关键词: | 维吾尔 语句 相似 计算方法 | ||
【主权项】:
一种维吾尔语句子相似度计算方法,其特征是:1. 维吾尔语倒排索引的建立:为有效的查找相似句子且计算其值对语料建立倒排索引,建立倒排索引时对维吾尔语句子的每一个单词进行词干提取;2. 对输入维吾尔语句子进行粗选:根据倒排索引查找的伪相似句子会很多,为提高维吾尔语句子相似度计算效率,需要排除相似度低的句子;3. 基于词的维吾尔语句子相似度计算:对粗选的相似句子集进行基于词的维吾尔语句子相似度计算;4. 维吾尔语简单结构相似度计算:通过该方法弥补因为维吾尔语句法分析没有实际应用而无法进行结构相似度计算的空白;5. 维吾尔语句子综合相似度计算:有效的结合维吾尔语的基于词的相似度计算和维吾尔语简单结构相似度计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆电力信息通信有限责任公司,未经新疆电力信息通信有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210579445.0/,转载请声明来源钻瓜专利网。
- 上一篇:鞋底防刺穿性能的检测装置
- 下一篇:一种Word格式提取及再利用方法