[发明专利]一种基于改进的KD树并行算法的大数据搜索方法在审

申请号：	201910219878.7	申请日：	2019-03-22
公开（公告）号：	CN110008215A	公开（公告）日：	2019-07-12
发明（设计）人：	戴春齐;黄飞;李超;赵昊	申请（专利权）人：	武汉大学
主分类号：	G06F16/22	分类号：	G06F16/22;G06F16/2458;G06F16/28
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	魏波
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于改进的KD树并行算法的大数据搜索方法，包括针对海量数据点进行聚类、并行建立KD树、多线程进行数据处理。改进的KD树并行算法，能够根据海量数据点的空间分布密度自动聚类，每个小类形成一簇并采用并行方式迅速建立KD树，节省建立KD树所消耗的时间。在建立KD树后，利用并行计算，使用多线程对数据进行处理，极大地节省了数据处理时间。该方法避免了建立一个庞大的KD树，而是建立了多个较小的KD树，减少了建KD树的时间，更减少了搜索最邻近点的时间，提高大数据搜索效率。
搜索关键词：	并行算法大数据搜索海量数据数据处理多线程改进并行方式并行计算空间分布搜索效率自动聚类邻近点聚类小类并行消耗
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于改进的KD树并行算法的大数据搜索方法，其特征在于，包括以下步骤：步骤1：对数据进行预处理；对数据采用基于spark平台的空间密度聚类算法结合多线程并行进行聚类处理；聚类处理后，原始数据被划分为若干簇，每个数据点都将被划分到某个簇中；步骤2：对于每一个簇，都建立一个KD树，每个点的最邻近点必将出现在簇内；步骤3：对于待处理的数据点，在KD树中搜索每个待处理的数据点的最邻近点；步骤4：求得所有需要处理的数据点的最邻近点以及最邻近距离。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910219878.7/，转载请声明来源钻瓜专利网。

上一篇：一种基于区块链的网络搭建大赛的查询系统
下一篇：基于区块链的数据库表操作方法、装置、设备和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于改进的KD树并行算法的大数据搜索方法在审

专利文献下载