[发明专利]一种基于单快照的多体模拟有损压缩技术在审
申请号: | 201810081727.5 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108182283A | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H03M7/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 压缩 索引数组 多体 快照 压缩技术 压缩比 优化 分子动力学模拟 构造预测 模拟数据 模型代替 拟合模型 线性曲线 预测模型 重新排序 返回 失真率 数据集 再使用 熵编码 数组 索引 分段 数据库 基数 宇宙 应用 | ||
1.一种基于单快照的多体模拟有损压缩技术,其特征在于,主要包括预测模型(一);有损压缩的优化(二)。
2.基于权利要求书1所述的预测模型(一),其特征在于,使用最后返回值模型代替线性曲线拟合模型,最后返回值模型比线性曲线拟合模型具有更高的压缩比,平均每个变量的压缩比提高了10.1%;最后返回值模型采用具有很多量化区间的线性比例量化的方法,使得熵编码可以应用于数据库的绝大部分数据。
3.基于权利要求书2所述的最后返回值模型以及线性曲线拟合模型,其特征在于,最后返回值模型利用先前一个数据点的预测值来估计当前时刻的数据点,即:最后返回值模型简单有效,在实际当中得到广泛的应用;
线性曲线拟合模型利用先前两个数据点的值来预测当前压缩的数据点,即:其中,vxi-1和vxi-2表示先前两个数据点的值。
4.基于权利要求书1所述的有损压缩的优化(二),其特征在于,包括针对分子动力学模拟数据集的有损压缩进行优化和针对宇宙模拟数据集的有损压缩进行优化;
其中,针对分子动力学模拟数据集的有损压缩进行优化,提出一种优化策略,其在保持相同的压缩比的情况下,把压缩速率提升至原来的两倍;这个策略包含以下两个步骤:
(1)执行部分基数排序,实现对R索引数组的排序,达到提高压缩性能的目的;通过部分基数排序提高压缩比;
(2)使用最后返回值有损压缩方法,作用在重新排序的数组(xx,yy,zz),而非直接作用于压缩的R索引数组;将数据集划分成为多个片段,基于每个片段上面的xx、yy和zz构造R索引数组;然后使用基数排序法对R索引数组进行分段排序。
5.基于权利要求书4所述的有损压缩,其特征在于,其与无损压缩是数据压缩技术的两个分类;设计并完善有损压缩技术,可以用来压缩科学数据;大部分的有损压缩技术是为网格数据集设计的,网格数据集里面的相邻的数据之间具有强相干性。
6.基于权利要求书4所述的R索引数组,其特征在于,首先,通过一个用户设定的误差门限分割坐标变量,将其值从浮点数转化成整数;然后,通过交叉存储三个坐标变量(xxi,yyi,zzi)的二进制表达式,产生R索引,即Ri。
7.基于权利要求书4所述的部分基数排序,其特征在于,忽略最后的几个最低有效位,然后从倒数第n位开始进行基数排序;由于R索引数组是由三个坐标变量构造得到的,所以在每一轮按三位对其进行排序;部分基数排序不会减低压缩比的原因在于,重新排序好的数据数组在非常小的索引范围内甚至在全部基数R索引排序方法里面,仍然能够展现局部的不规则性。
8.基于权利要求书7所述的排序,其特征在于,排序是一种用于增强数据连续性的经典方法,其具有诸多局限性,特别在快照具有大量的数据点时,其局限性更加显著;其局限性表现在:第一,虽然排序法是最快的算法,但它也是一个十分耗时的操作;第二,由于重新排序的数据的位置,压缩器必须采用一个额外的索引数组来记录每一个点的原始位置,这将极大地限制压缩比;但是,对于分子元素来说,不需要对额外的索引信息进行排序,因为只要相同分子对应的元素的位置或者索引具有连续性,那么在重构的数据集里面每一个数组的分子元素可以被重新排序。
9.基于权利要求书4所述的针对宇宙模拟数据集的有损压缩进行优化,其特征在于,根据基于速度的R索引数组排序和基于坐标-速度的R索引排序,利用两个候选的解决方案来重组数据。
10.基于权利要求书9所述的基于速度的R索引数组排序和基于坐标-速度的R索引排序,其特征在于,基于速度的R索引数组排序的策略与传统的优化方法相似;该策略平均可以提高20%的速度变量的压缩比,但其坐标变量的压缩比却严重下降;
而对于基于坐标-速度的R索引排序,由于在至少使用一类R索引排序策略时,xx、zz、vx、vy、vz的压缩比可以得到提升,但是yy的压缩比总是减少;特殊地,yy在很宽的索引范围里是递增排序的,因此任何想要对其变量进行重新排序的策略,诸如基于R索引的排序策略,都会得到混乱的排序结果,从而得到低压缩比;所以,具有高度自相关的有序变量不适用于基于R索引的排序方法,而改进的使用最后返回值模型的有损压缩方法,具有最大的压缩比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810081727.5/1.html,转载请声明来源钻瓜专利网。