[发明专利]一种基于维吾尔文音节的可检索式压缩和解压方法有效
申请号: | 201910529448.5 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110263339B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 瓦依提·阿不力孜;加米拉·吾守尔 | 申请(专利权)人: | 新疆大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/216;G06F16/174;G06F16/335 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 郑义 |
地址: | 830046 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于维吾尔文音节的可检索式压缩和解压方法,包括压缩过程和解压过程;解压过程包括以下步骤:S1:打开压缩包,读取编码序列;S2:当遇到音节编码X字符时,将音节编码X转换成对应的维文;维文中出现的ASCII码看成一个维文音节;S2:当遇到字符串Mark_S时,将Mark_S和Mark_E中间的字符串Y直接提出进行使用;S3:对S2和S3中,解码的内容进行编辑,获取原文,以完成解压过程。本发明中,实现对维文的压缩和解压,使用方便,效率高。同时,本发明具有很好的压缩比率,提高压缩与解压效率,实现无解压状态下内容检索,提高检索效率。 | ||
搜索关键词: | 一种 基于 维吾尔文 音节 检索 压缩 解压 方法 | ||
【主权项】:
1.一种基于维吾尔文音节的可检索式压缩方法,其特征在于,包括压缩过程和解压过程;压缩过程包括以下步骤:S1:对维文进行分词;S2:每一个维文词语进行音节切分,非维文部分不变;其中,ASCII码前128个字符视为维文的128个音节,编码就是其ASCII码;S3:开始编码;S4:将维文的每个音节获取对应的音节编码X;S5:在非维文和非ASCII范围的字符串Y的前、后加上识别标志字符串;识别标志字符串分别为:Mark_S和Mark_E;其中,字符串Mark_S和字符串Mark_E分别作为开始字符串和结束标志字符串;非维文编码格式为:“Mark_S字符串Y Mark_E”,以将字符串Y看作为一个符号;S6:获取所有维文编码序列,进行压缩,得到压缩包;解压过程包括以下步骤:S1:打开压缩包,读取编码序列;S2:当遇到音节编码X字符时,将音节编码X转换成对应的维文;S2:当遇到字符串Mark_S时,将Mark_S和Mark_E中间的字符串Y直接提出进行使用;S3:对S2和S3中,解码的内容进行编辑,获取原文,以完成解压过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910529448.5/,转载请声明来源钻瓜专利网。