[发明专利]基于布隆过滤器的数据验真方法及系统及装置及介质在审
| 申请号: | 202110063100.9 | 申请日: | 2021-01-18 |
| 公开(公告)号: | CN112800055A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 洪薇;洪健;李京昆;刘文思 | 申请(专利权)人: | 湖北宸威玺链信息技术有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
| 代理公司: | 成都云纵知识产权代理事务所(普通合伙) 51316 | 代理人: | 熊曦;陈婉鹃 |
| 地址: | 430000 湖北省武汉市武昌区水果湖街*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 过滤器 数据 方法 系统 装置 介质 | ||
本发明公开了基于布隆过滤器的数据验真方法及系统及装置及介质,涉及数据验真领域,包括:将源数据的数据记录上传至区块链存储;获取待验真的第一数据记录,从区块链上获取对应的第二数据记录;基于第一数据记录生成第一布隆过滤器数组;基于第二数据记录生成第二布隆过滤器数组;比较第一布隆过滤器数组和第二布隆过滤器数组,若第一布隆过滤器数组与第二布隆过滤器数组中相同下标位置上的元素全部相同,则数据验真通过;否则数据验真失败,并基于第一布隆过滤器数组与第二布隆过滤器数组中元素不同的下标位置定位出第一数据记录中数据不一致的字段;本发明能够在数据记录中多个字段不一致的情况下,提高数据验真的效率,减小字段比对的开销。
技术领域
本发明涉及数据验真领域,具体地,涉及基于布隆过滤器的数据验真方法及系统及装置及介质。
背景技术
数据验真是区块链的一项基础功能,它对原始数据的记录进行哈希摘要计算,然后将其同存储在链上的原始数据记录的哈希摘要值进行字符串对比,利用区块链不可篡改的特性,如果对比结果一致,则验真通过,否则即说明原始数据的值发生了变化。通常验真的粒度是记录级别,也即判断一条记录的结果是否发生了变化,但对于某些场景和应用,需要细化到数据项或字段级的验真,也即要精确定位到记录中具体是某一项或某几项数据发生了变化。业界常规的做法是将对应记录的哈希拆分成一个个数据项或字段的哈希,然后上链存证,在验真比对时,首先进行记录级哈希比对,如果不一致,则继续逐个数据项或字段进行比对,直至找出不一致的数据项或字段。这种方法在数据项或字段数较多的情况下,在最坏情况下其计算复杂度是记录级验真的N倍(N为记录中包含的数据项或字段数),对于大数据量下的密集验真任务,这种方法的性能是无法满足应用要求的。基于这种方法的改进型版本,二叉哈希树的方法,在单字段不一致的情况下,可以显著降低验真的计算开销,但存在多个字段不一致的情况下,则需要的时间会成倍上升,并且会趋近于所有字段的比对开销。
发明内容
本发明目的是解决在数据记录中多个字段不一致的情况下,提高数据验真的效率,减小字段比对的开销。
为实现上述发明目的,本发明提供了基于布隆过滤器的数据验真方法,所述方法包括:
将源数据的数据记录上传至区块链存储;
获取待验真的第一数据记录,并从区块链上获取与第一数据记录对应的第二数据记录;
基于第一数据记录生成第一布隆过滤器数组;
基于第二数据记录生成第二布隆过滤器数组;
比较第一布隆过滤器数组和第二布隆过滤器数组,若第一布隆过滤器数组与第二布隆过滤器数组中相同下标位置上的元素全部相同,则数据验真通过;否则数据验真失败,并基于第一布隆过滤器数组与第二布隆过滤器数组中元素不同的下标位置定位出第一数据记录中数据不一致的字段。
其中,本发明提供了一种区块数据验真时快速定位一个或多个字段不一致的方法。本发明的核心思路和创新是将原始的线性顺序的数据项比对,以及适用于单个字段的基于二叉哈希树的快速定位比对,优化为基于bloom filter的快速比较和定位,即使在所有字段都不一致的情况下,其计算开销也仅仅只是bloom filter数组的长度,能够满足大数据量下的一到多个字段的密集验真任务的需要。
优选的,本方法在生成第一布隆过滤器数组和第二布隆过滤器数组之前还包括以下步骤:
设置布隆过滤器数组,布隆过滤器数组中元素的初始值为0,布隆过滤器数组中字段数量为第一数据记录中字段数量的两倍。
优选的,本方法中基于数据记录生成相应的布隆过滤器数组的方式为:
基于哈希函数计算数据记录中每个字段的哈希值获得第一计算结果;
针对每个字段对应的第一计算结果取模计算得到第二计算结果,第二计算结果为0到N-1之间的数值,N为布隆过滤器数组的大小;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北宸威玺链信息技术有限公司,未经湖北宸威玺链信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110063100.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





