[发明专利]基于信息散度的视频大数据冗余删除方法有效
申请号: | 201710281352.2 | 申请日: | 2017-04-26 |
公开(公告)号: | CN107040740B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 甘新标;刘杰;杨灿群;徐涵;胡庆丰;龚春叶;李胜国;邹丹;晏益慧;黄嘉昆;熊成伟 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | H04N5/76 | 分类号: | H04N5/76;H04N5/91 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 信息 视频 数据 冗余 删除 方法 | ||
本发明公开了一种基于信息散度的视频大数据冗余删除方法,目的是提出一种冗余视频数据删除方法,节省存储容量,减少视频大数据计算分析时间,提高视频大数据维护管理的效率。技术方案是先将视频大数据用视频大数据集V来表示,对V进行归一化,然后定义面向视频图像帧矢量的K‑L散度和信息量分布矩阵M_L,确认各视频图像帧矢量对V的信息量贡献,删除V中的信息量贡献最小的冗余视频图像帧。采用本发明能缓解视频数据的存储压力,提高视频数据存储效率,加快视频大数据计算分析速率,提升整个大数据视频应用系统的运营效率。
技术领域
本发明涉及冗余删除方法,尤其涉及信息领域视频大数据冗余的删除方法。
背景技术
随着社会信息化不断推进,信息存储应用领域越来越广泛,在过去的5年内全球数字化信息量增长迅速,已从之前的TB级上升到PB级,甚至EB级。随着大数据时代的来临,数据增长将是大型企业部署lT设施的最大挑战,随着数据规模和数据体积的持续增大,一方面需要投入巨额资金购置存储容量,另一方面数据的计算分析运营成本也将显著增加。
研究表明,在备份和归档存储等应用系统所保存的数据中,高达80%~90%的数据是冗余的,而随着时间推移,冗余数据的比例也将继续上升。因此,存储系统中数据高冗余问题受到越来越多研究人员的关注,如何缩减存储系统数据存储容量已成为一个热门的研究课题,而重复数据冗余删除技术是其中一种容量优化技术,它通过消除存储系统中冗余的数据,缩减系统中实际存储的数据或通过网络传输的数据,在备份、长期归档和数据灾难恢复等方面已得到了广泛的应用。在工业界,DataDomain DDFs,IBM Diligent,EMC的Avarma,Veritas的PureDisk以及CommVault的Shpana是比较知名的冗余数据删除产品,这些产品通常可以达到20:1的冗余数据删除率;同时,学术界也进行了深入研究,包括美国的MIT、OSU、UC和Stanford等大学,德国Paderbom大学,英国剑桥大学,以及中国的CUHK、清华大学、国防科技大学以及华中科技大学等高校。
冗余数据删除是基于数据自身的冗余度来检测数据流中的相同数据对象,只传输和存储唯一的数据对象副本,并使用指向唯一数据对象副本的引用或关联来替换其他冗余。相比于传统的数据压缩技术,冗余数据删除技术不仅可以消除文件内的数据重复,还能消除共享数据集内文件之间的数据重复。根据实施冗余数据删除操作位置的不同,分为源和目标端冗余数据删除;根据实施冗余数据删除操作时机的不同,分为离线、近线和在线删除;根据实施冗余数据删除操作粒度的不同,分为文件级和块级删除;根据冗余数据删除所服务数据实体的存储与访问方式的不同,分为主存储和从存储删除。
无论是源和目标端冗余数据删除、离线、近线和在线删除、文件级和块级删除,还是主存储和从存储删除,冗余数据删除的对象几乎都是重复数据删除,对于非简单重复而有关联关系的冗余数据即一个数据对象可以由其它数据对象来表示的冗余数据,上述各种数据删除技术就无能为力了。
大数据时代,视频数据量庞大,种类繁多,结构复杂,很多统计问题中将信息量作为统计的基本度量,如非线性统计问题,数据挖掘问题,投影寻踪问题等,在这些涉及到随机分布之间差异的问题中提出了大量的度量准则,一般称之为信息散度,即使用基于概率分布Q的编码来编码来自概率分布P的样本所需要的额外的比特数,是一种描述两个概率分布差异的一种方法。最早的信息散度是Kullback和Leibler提出的相对熵,也称K-L距离或K-L散度,是一种用来描述两信息量差异的方法。随着大数据时代的兴起,具有关联关系的视频数据冗余现象将越来越突出,面向视频大数据的冗余数据删除变得更加紧迫和重要。
如何基于K-L散度,解决面向视频大数据的冗余数据删除难题是本领域技术人员关注的重要技术问题。
发明内容
本发明要解决的技术问题在于:针对非简单重复而有关联关系的冗余视频数据,提出一种基于信息散度的视频大数据冗余删除方法,节省存储容量,减少视频大数据计算分析时间,提高视频大数据维护管理的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710281352.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:功率放大电路
- 下一篇:一种低噪声放大器及其控制方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置