[发明专利]一种均匀随机锚点生成方法及锚点自适应多视图聚类方法在审
申请号: | 202210825866.0 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115438710A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 纪霞;席华梅 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 合肥市泽信专利代理事务所(普通合伙) 34144 | 代理人: | 方荣肖 |
地址: | 230601 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 均匀 随机 生成 方法 自适应 视图 | ||
本发明涉及一种均匀随机锚点生成方法及锚点自适应多视图聚类方法。锚点生成方法包括如下步骤:第一步:对视图进行归一化处理得到多个样本点;第二步:将多个所述样本点映射到一个坐标系中,计算每个样本点到原点的距离;按照距离的远近将样本点划分到多个距离类别中;第三步:根据距离类别将多个样本点所在的区域划分为若干区块,并使每个区块内具有相同数量的样本点;第四步:在每个区块中随机提取相同数量的多个样本点作为锚点;多个锚点合并为锚点集。上述均匀随机锚点生成方法以较低的运行时间生成更具代表性的锚点,更好地表示每个视图的样本点集的潜在结构,兼顾了锚点生成方法的高效率与高代表性。
技术领域
本发明涉及技术领域,特别是涉及一种均匀随机锚点生成方法、一种基于锚点的自适应多视图聚类方法。
背景技术
随着传感器和互联网的快速普及,同一对象通常能够在多个视图下进行采集和表达。例如,不同的新闻机构报道的同一事件;不同监控视角下的同一物体;不同的语言翻译的同一文本。所有这些都被称为多视图数据,它们往往提供互补和兼容的信息,充分学习和利用多视图来分析标签信息未知的数据,称为多视图学习。
在多视图数据的处理过程中,为了提高每个视图数据的处理效率,通常采用在视图中提取锚点从而简化运算量。其中,锚点用以表征视图数据的潜在结构。
现有的锚点生成方法中,随机选择生成锚点策略具有最佳的时效性,但其选择的锚点不具备对多视图数据的代表性。K-Means锚点生成策略虽然能选择出具有代表性的锚点,但由于计算的复杂性使其难以应用在大规模多视图数据中。
发明内容
基于此,有必要针对现有锚点生成方法难以在保证锚点具有代表性的同时提高锚点生成效率的问题,提供一种均匀随机锚点生成方法及锚点自适应多视图聚类方法。一种均匀随机锚点生成方法,其包括如下步骤:
第一步:对视图进行归一化处理得到多个样本点;
第二步:将多个样本点映射到一个坐标系中,计算每个样本点到原点的距离;进而将所有样本点按照距离的远近进行分类,得到多个距离类别;
第三步:根据距离类别将多个样本点所在的区域划分为若干区块,并使每个区块内具有相同数量的样本点;
第四步:在每个区块中随机提取相同数量的多个样本点作为锚点。
上述均匀随机锚点生成方法通过对样本点测量相对距离,并根据距离对样本点所在区域进行划分,通过随机选取的方式在每个区块中生成相同数量的锚点,从而以较低的运行时间生成更具代表性的锚点,更好地表示每个视图的样本点集的潜在结构,兼顾了锚点生成方法的高效率与高代表性。
在其中一个实施例中,区块的划分方法如下:
设样本点集X为:X=[x1,x2,x3,...,xn]T∈Rn×d,数据原点x0为:x0=[0,0,0,...,0]∈R1×d;
其中,n代表样本点数量,d代表特征维度;
记f为X中的样本点xi到数据原点x0的距离度量函数,di(i=1,2,...,m)表示xi到x0关于f的距离,di=f(x0,xi);将样本点集中所有样本点到数据原点的欧氏距离合并,得到欧氏距离集合D为:
D={d1,d2,…,dn};
按照di的数值进行升序排序,得到正序距离集合D’为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210825866.0/2.html,转载请声明来源钻瓜专利网。