[发明专利]基于SQL的度量空间数据相似度查询方法及装置有效
| 申请号: | 201710771206.8 | 申请日: | 2017-08-31 |
| 公开(公告)号: | CN107562872B | 公开(公告)日: | 2020-03-24 |
| 发明(设计)人: | 卢卫;杜小勇;侯佳佳 | 申请(专利权)人: | 中国人民大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张芳;刘芳 |
| 地址: | 100872 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 sql 度量 空间 数据 相似 查询 方法 装置 | ||
本发明提供一种基于SQL的度量空间数据相似度查询方法及装置,通过对数据集进行分区处理,每个分区中包含数据对象和参考点;根据参考点确定分区内每个数据对象与参考点之间的第一距离;根据第一距离,确定每个数据对象的索引结构。根据查询请求中的查询对象确定查询对象与每个分区内参考点之间的第二距离,并根据第二距离和预设距离阈值,确定查询对象在每个所述分区内的查询范围;在数据对象的索引结构内确定与每个所述分区内的查询范围对应的目标数据对象。本发明可基于SQL技术的数据库来实现度量空间数据相似度查询,以提高对该RDBMS数据库相似度查询的适用性和性能。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于SQL的度量空间数据相似度查询方法及装置。
背景技术
相似度查询是通过给定数据集R、查询对象q、相似度函数和用户指定阈值θ,从而在数据集R中找出与查询对象q的距离小于等于用户指定阈值θ的所有数据对象r,即认为数据对象r与查询对象q相似。相似度查询的应用可遍及各个领域,包括人脸识别、指纹识别、空间位置查询、文本纠错、模式识别(如DNA或蛋白质序列)等。而随着数据集中数据量的快速增长及数据类型呈现出的多样性发展趋势,目前相似度查询针对的对象从早期的欧几里得空间的维度数据、文本空间的字符串数据,延伸到目前比较通用的不限于某个数据类型的度量空间数据,度量空间下的数据集中任意元素之间的距离是可定义的。
由于关系数据库管理系统(Relational Database Management System,简称RDBMS)可以提供统一的结构化查询语言(Structured Query Language,简称SQL)技术,还可结合其他查询条件过滤数据,同时数据库本身支持数据更新,所以利用RDBMS进行度量空间数据相似度查询可大大提高查询的性能。但是,现有的度量空间数据相似度查询方法通常是针对特定的应用领域建立新型的索引结构,并基于构建的索引结构进行相似度查询。但是这些新型的索引结构与RDBMS中支持的索引结构类型不匹配,即RDBMS中的索引结构无法识别这些新型索引的格式,因此也就无法借助RDBMS强大的数据管理功能实现度量空间数据的相似度查询,导致查询效率低。
因此,亟需一种对基于SQL技术的数据库,如RDBMS来实现度量空间数据相似度查询的方法,以提高对该RDBMS数据库相似度查询的适用性和性能。
发明内容
本发明提供一种基于SQL的度量空间数据相似度查询方法及装置,以解决现有技术中度量空间数据相似度查询方法构建的索引结构与RDBMS中支持的索引结构类型不匹配的问题,以实现基于SQL技术的数据库来实现度量空间数据相似度查询的方法,以提高对该RDBMS数据库相似度查询的适用性和性能。
本发明第一个方面提供一种基于SQL的度量空间数据相似度查询方法,包括:
对数据集进行分区处理,得到多个分区;其中,每个分区中包含:数据对象,参考点;
根据所述参考点,确定分区内每个数据对象与参考点之间的第一距离;
根据所述第一距离,确定每个数据对象的索引结构;
接收用户的查询请求,所述查询请求中包括查询对象、查询对象与目标数据对象之间的预设距离阈值;
确定所述查询对象与每个分区内参考点之间的第二距离,并根据所述第二距离、所述预设距离阈值,确定查询对象在每个所述分区内的查询范围;
在每个分区的所述查询范围内,根据所述查询范围内的数据对象的索引结构,确定与所述查询对象对应的目标数据对象。
在本发明一实施例中,上述对数据集进行分区处理,得到多个分区,包括:
在数据集中,确定每个数据对象与每个参考点之间的距离;
将每个参考点对应的与其距离最小的数据对象划分为一个分区,得到与考点数目相匹配的多个分区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710771206.8/2.html,转载请声明来源钻瓜专利网。





