[发明专利]基于聚类及全局/局部距离综合的多重度量学习方法在审

专利信息
申请号: 201811477231.6 申请日: 2018-12-05
公开(公告)号: CN109840466A 公开(公告)日: 2019-06-04
发明(设计)人: 傅予力;张隆琴;赖凯敏;向友君 申请(专利权)人: 华南理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06K9/66
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 度量 聚类 局部距离 样本 全局距离 三元组 学习 随机梯度下降法 折页 三元组集合 训练样本集 测试样本 分类过程 分类结果 局部特征 距离度量 全局特征 损失函数 准确度 最近邻 分类 构建 全局
【权利要求书】:

1.一种基于聚类及全局/局部距离综合的多重度量学习方法,其特征在于,所述的多重度量学习方法包括以下步骤:

对训练样本进行K-Means聚类并构建三元组集合;

将样本x和任一样本y的距离由全局距离度量和局部距离度量综合表示;

同时学习K+1个距离度量,包括1个全局距离度量和K个局部距离度量;

对输入的测试样本,计算样本所属聚类标记,再在该聚类的训练样本集中利用最近邻方法计算测试样本的分类结果。

2.根据权利要求1所述的基于聚类及全局/局部距离综合的多重度量学习方法,其特征在于,所述的构建三元组集合的具体步骤如下:

假设xi∈Rd表示训练样本集中第i个样本,(xi,xj,xl)表示一个三元组约束,其中xi和xj属于同一类别,xi和xl属于不同类别,T表示三元组集合,对于每个样本,在没有先验知识的前提下,通过选择与该样本同类并且最近的k1个样本分别和与该样本不同类的最近的k2个样本构成三元组,并且根据xi所属的聚类标记,将T分为K个簇{T1,...,TK}用于训练K个局部距离度量。

3.根据权利要求1所述的基于聚类及全局/局部距离综合的多重度量学习方法,其特征在于,所述的将样本x和任一样本y的距离由全局距离度量和局部距离度量综合表示,包括:

假设样本x所属的聚类标记为c,Mc为该聚类对应的局部距离度量,M0为全局距离度量,令样本x和任一样本y的距离为:

其中0≤μ≤1是权重超参数,当μ=0时表示两个样本的距离只由局部距离度量Mc决定,当μ=1时表示两个样本的距离只由全局距离度量M0决定,0<μ<1表示两个样本的距离由全局距离度量和局部距离度量决定。

4.根据权利要求1所述的基于聚类及全局/局部距离综合的多重度量学习方法,其特征在于,所述的学习K+1个距离度量,包括1个全局距离度量和K个局部距离度量中,学习模型为:

M0,...,MK≥0

其中,M0表示全局距离度量,Mc,c∈[1,K]表示聚类c下的局部距离度量,所学习的K+1个矩阵均为半正定矩阵,表示三元组(xi,xj,xl)中xi与xl的距离和xi与xj距离之差,其中,Zijl=(xi-xl)(xi-xl)T-(xi-xj)(xi-xj)T,ξijl是对应的松弛变量,α>0和β>0为超参数,相对较大的α使M0趋近于0矩阵,此时学习到的局部距离度量彼此独立,相对较大的β使学习到的各个局部距离度量之间与M0有较大的相似性,此时各个局部距离度量之间有较大的相关性,Nc表示聚类c下的三元组数量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811477231.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top