[发明专利]一种用于定位相似实例的方法、装置和电子设备有效
申请号: | 201910024097.2 | 申请日: | 2019-01-10 |
公开(公告)号: | CN110046180B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 陈治 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;H04L67/10 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 定位 相似 实例 方法 装置 电子设备 | ||
本申请实施例提供了一种用于定位相似实例的方法、装置和电子设备,该方法包括:接收待比对实例的待比对标识,根据所述待比对标识在数据库中查询所述待比对实例的信息,所述待比对实例的信息包括所述待比对实例的指纹信息,在搜索服务器中获取与所述待比对实例的指纹信息相似度最高的相似指纹信息,在所述搜索服务器中获取所述相似指纹信息对应的相似实例的相似标识,从数据库中获取与所述相似标识对应的相似实例。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种用于定位相似实例的方法、装置和电子设备。
背景技术
当系统出现报警时,需要查找历史上与异动实例最相似的实例以便获取异动的原因。但是系统中保存着多日中存储的数亿条历史实例数据,要在如此巨大的历史实例集合中找到最相似的实例充满了挑战。
一种现有方案为待比对实例与相似实例集合中的所有实例计算一遍编辑距离,最后取编辑距离最小的实例作为最相似的实例。然而,两个实例之间的编辑距离的计算是非常耗时的过程,因此方案过于耗时。
另一种现有方案为基于最小哈希值(英文:minHash)的相似实例定位。minHash算法基本原理如下:对于等概率的随机排列,两个集合的minHash正好相等的概率恰好等于这个集合的Jaccard相似度,利用该特性可以为每一个集合生成一个minHash签名,从而达到降低维度的目的,降维的同时还保持了集合之间的相似性。将上述算法应用于实例对比时,这里的集合就是指实例的特征集合。根据算法的原理,首先,在构造实例的特征矩阵时需要事先构建所有实例的特征全集,因此一旦特征全集发生改变,每一个实例的minHash签名就会随之改变,即所有实例的minHash签名需要全部重新计算。例如,某个实例出现了特征全集以外的新特征。其次,因为以特征全集为每个实例构造minHash签名,这将导致实例minHash的计算过程是高维的且需要很多无用维度参与的计算。再次,因为要事先构建特征全集索引,所以需要很大的存储开销。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本申请实施例的目的是提供一种用于定位相似实例的方法、装置和电子设备,能够快速定位相似实例。
为解决上述技术问题,本申请实施例是通过以下各方面实现的。
第一方面,本申请实施例提供了一种用于定位相似实例的方法,包括:接收待比对实例的待比对标识;根据所述待比对标识在数据库中查询所述待比对实例的信息,所述待比对实例的信息包括所述待比对实例的指纹信息;在搜索服务器中获取与所述待比对实例的指纹信息相似度最高的相似指纹信息;在所述搜索服务器中获取所述相似指纹信息对应的相似实例的相似标识;从数据库中获取与所述相似标识对应的相似实例。
第二方面,本申请实施例提供了一种用于定位相似实例的装置,包括:接收模块,接收待比对实例的待比对标识;查询模块,根据所述待比对标识在数据库中查询所述待比对实例的信息,所述待比对实例的信息包括所述待比对实例的指纹信息;获取模块,在搜索服务器中获取与所述待比对实例的指纹信息相似度最高的相似指纹信息;在所述搜索服务器中获取所述相似指纹信息对应的相似实例的相似标识;处理模块,从数据库中获取与所述相似标识对应的相似实例。
第三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机可执行指令,所述计算机可执行指令被所述处理器执行时实现步骤:接收待比对实例的待比对标识;根据所述待比对标识在数据库中查询所述待比对实例的信息,所述待比对实例的信息包括所述待比对实例的指纹信息;在搜索服务器中获取与所述待比对实例的指纹信息相似度最高的相似指纹信息;在所述搜索服务器中获取所述相似指纹信息对应的相似实例的相似标识;从数据库中获取与所述相似标识对应的相似实例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910024097.2/2.html,转载请声明来源钻瓜专利网。