[发明专利]一种数据处理的方法和装置有效
申请号: | 202111156887.X | 申请日: | 2021-09-30 |
公开(公告)号: | CN113595557B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 李金虎;王广官 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 310024 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理的方法,其特征在于,所述方法包括:
获取目标数据;
对所述目标数据进行分块,得到一个或多个数据块;
针对每个数据块,确定一个或多个数据单元集,并分别对所述一个或多个数据单元集进行压缩,得到每个数据单元集的压缩数据;
根据所包含的数据单元集的压缩数据,得到每个数据块的压缩数据,并根据所述一个或多个数据块的压缩数据,得到所述目标数据的压缩数据;
其中,所述分别对所述一个或多个数据单元集进行压缩,得到每个数据单元集的压缩数据,包括:
对于每个数据单元集,根据所包含的数据单元的字节长度之和,确定一种或多种字节组合方式,并按照所述一种或多种字节组合方式,对所述数据单元集进行压缩,得到一个或多个候选压缩数据;
从所述一个或多个候选压缩数据中,确定所述数据单元集的压缩数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所包含的数据单元的字节长度之和,确定一种或多种字节组合方式,包括:
在当前数据单元集所包含的数据单元的字节长度之和等于预设字节长度的情况下,根据所述预设字节长度,确定一个或多种字节组合方式;
在当前数据单元集所包含的数据单元的字节长度之和小于预设字节长度的情况下,根据当前数据单元所包含的数据单元的字节长度之和,确定一种或多种字节组合方式。
3.根据权利要求2所述的方法,其特征在于,所述从所述一个或多个候选压缩数据中,确定所述数据单元集的压缩数据,包括:
从所述一个或多个候选压缩数据中,确定字节长度最短的候选压缩数据为所述数据单元集的压缩数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述针对每个数据块,确定一个或多个数据单元集,包括:
针对每个数据块,从所包含的数据单元中,依次确定字节长度之和等于预设字节长度的一个或多个数据单元,作为一个数据单元集;
在剩余的数据单元的字节长度之和小于预设字节长度的情况下,将剩余的数据单元作为一个数据单元集。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标数据进行分块,得到一个或多个数据块,包括:
按照预设字节长度或预设字节长度的倍数,对所述目标数据进行分块,得到一个或多个数据块;
在剩余的数据的字节长度之和小于预设字节长度或预设字节长度的倍数的情况下,将剩余的数据作为一个数据块。
6.根据权利要求1所述的方法,其特征在于,每个数据单元集的压缩数据携带有用于记录压缩前数据的字节长度的信息。
7.根据权利要求1所述的方法,其特征在于,所述多个数据块之间采用并行的方式压缩,在每个数据块内部采用串行的方式压缩。
8.一种数据处理的方法,其特征在于,所述方法包括:
获取目标数据的压缩数据;其中,所述目标数据的压缩数据为根据一个或多个数据块的压缩数据得到的,每个数据块的压缩数据为根据所包含的数据单元集的压缩数据得到的,每个数据单元集的压缩数据为对所述目标数据进行分块,得到一个或多个数据块,针对每个数据块,确定一个或多个数据单元集,并分别对所述一个或多个数据单元集进行压缩得到的;
根据所述目标数据的压缩数据,得到一个或多个数据块的压缩数据;
对每个数据块的压缩数据进行解压缩,得到每个数据块的解压缩数据;
根据所述一个或多个数据块的解压缩数据,得到目标数据;
其中,所述分别对所述一个或多个数据单元集进行压缩,包括:
对于每个数据单元集,根据所包含的数据单元的字节长度之和,确定一种或多种字节组合方式,并按照所述一种或多种字节组合方式,对所述数据单元集进行压缩,得到一个或多个候选压缩数据;
从所述一个或多个候选压缩数据中,确定所述数据单元集的压缩数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111156887.X/1.html,转载请声明来源钻瓜专利网。