[发明专利]矩阵数据索引方法及装置在审
申请号: | 201410159202.0 | 申请日: | 2014-04-18 |
公开(公告)号: | CN105095208A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 穆亚东;赫彩凤;范伟 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 数据 索引 方法 装置 | ||
技术领域
本发明涉及数据处理技术,尤其涉及一种矩阵数据索引方法及装置。
背景技术
矩阵是一种常见的数据表达形式,广泛应用于多个领域。但是,矩阵数据往往尺寸较大,直接保存矩阵会占用较大的存储空间,也不便于对矩阵数据进行索引;当前,针对矩阵的索引,可以有多种不同的算法,其中,在矩阵维度较大时,索引函数的复杂度是一个不可忽略的问题,具体地,对于一个矩阵元素个数为百万量级,对于一些复杂度高的索引函数,其参数个数也会在百万量级,存储大量的索引函数也会耗费大量的存储空间。
现有技术中,对于矩阵数据的索引,主要是将矩阵数据展开为向量,即将矩阵逐行或逐列拼接,然后采用向量索引技术加以处理。现有的向量索引技术主要包括基于树的方法,例如:K维树(k-dtree)方法。但是,采用这种方法,在矩阵维度较高的情况下无法获取合理的计算复杂度。
另外,现有技术中,对于矩阵元素较多的情况,还采用对矩阵元素欠采样(under-sampling)的方法,这种方法通过减少参与索引计算的元素个数,降低索引函数的复杂度。但是,采用这种方法会造成有效信息的损失,从而导致索引函数性能下降。
发明内容
本发明实施例提供一种矩阵数据索引方法及装置,用于解决现有技术矩阵索引方法在矩阵维度较高的情况下无法获取合理的计算复杂度,以及有效信息损失的问题。
本发明实施例第一方面提供一种矩阵数据索引方法,包括:
获取目标矩阵,其中,所述目标矩阵包括n×m个元素;
利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码;
根据所述二值哈希码进行矩阵数据索引。
结合第一方面,在第一方面的第一种可能的实施方式中,所述利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码之前,还包括:
根据所述目标矩阵,获取预设组高斯随机变量;
其中,每组所述高斯随机变量包括:第一高斯随机变量和第二高斯随机变量,所述第一高斯随机变量为n维向量,所述第二高斯随机变量为m维向量。
结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述二值哈希码包括0和1。
结合第一方面的第二种可能的实施方式,在第一方面的第三种可能的实施方式中,所述双线性哈希函数为其中,X表示所述目标矩阵,uk表示所述第一高斯随机变量,vk表示所述第二高斯随机变量,表示所述uk的转置向量。
结合第一方面的第二种可能的实施方式,在第一方面的第四种可能的实施方式中,所述利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码之前,还包括:
根据所述目标矩阵,获取所述目标矩阵的随机置换函数。
结合第一方面的第四种可能的实施方式,在第一方面的第五种可能的实施方式中,所述双线性哈希函数为其中,φ(X)表示所述目标矩阵的置换函数,uk表示所述第一高斯随机变量,vk表示所述第二高斯随机变量,表示所述uk的转置向量。
本发明第二方面提供一种矩阵数据索引装置,包括:
获取模块,用于获取目标矩阵,其中,所述目标矩阵包括n×m个元素;利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码;
索引模块,用于根据所述二值哈希码进行矩阵数据索引。
结合第二方面,在第二方面的第一种可能的实施方式中,所述获取模块,还用于在利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码之前,根据所述目标矩阵,获取预设组高斯随机变量;
其中,每组所述高斯随机变量包括:第一高斯随机变量和第二高斯随机变量,所述第一高斯随机变量为n维向量,所述第二高斯随机变量为m维向量。
结合第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述二值哈希码包括0和1。
结合第二方面的第二种可能的实施方式,在第二方面的第三种可能的实施方式中,所述双线性哈希函数为其中,X表示所述目标矩阵,uk表示所述第一高斯随机变量,vk表示所述第二高斯随机变量,表示所述uk的转置向量。
结合第二方面的第二种可能的实施方式,在第二方面的第四种可能的实施方式中,所述获取模块,还用于在利用双线性哈希函数,获取所述目标矩阵对应的二值哈希码之前,根据所述目标矩阵,获取所述目标矩阵的随机置换函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410159202.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:移动终端新闻浏览的方法及装置
- 下一篇:基于PDF级的局部挂网处理方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置