[发明专利]用于对输入数据进行聚类的设备和方法在审

专利信息
申请号: 201880093500.0 申请日: 2018-05-17
公开(公告)号: CN112154453A 公开(公告)日: 2020-12-29
发明(设计)人: 埃拉德·佐里夫;奥尔加·科根;尤尼·乔克伦 申请(专利权)人: 华为技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08;G06N20/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 输入 数据 进行 设备 方法
【权利要求书】:

1.一种用于对输入数据(101)进行聚类的设备(100),其特征在于,所述输入数据(101)为包括数据点的数据集,所述设备(100)包括:

-自动编码单元(102),用于在所述设备(100)的第一操作阶段中,降低所述输入数据(101)的维度,以及/或者从所述输入数据(101)中提取与聚类相关的特征,从而产生低维数据(103);

-聚类单元(104),用于在所述设备(100)的第二操作阶段中,根据所述低维数据(103)获得至少一个集群(105),以及将所述低维数据(103)中的每个数据点与所述至少一个集群(105)的一个集群关联,

其中,所述自动编码单元(102)优化所述低维数据(103),以对所述低维数据(103)进行无损重建。

2.根据权利要求1所述的设备(100),其特征在于,所述低维数据(103)包括线性独立代码行,从而最小化重建损失。

3.根据上述权利要求中任一项所述的设备(100),其特征在于,所述输入数据(101)的维度降低包括将第一函数应用于所述输入数据(101),其中,所述第一函数用于最小化所述输入数据(101)中的数据点的成对相似度,以提供所述低维数据(103)。

4.根据权利要求3所述的设备(100),其特征在于,所述第一函数将相似度度量应用于所述输入数据(101)中的数据点。

5.根据权利要求4所述的设备(100),其特征在于,所述第一函数应用的相似度度量为余弦相似度。

6.根据上述权利要求中任一项所述的设备(100),其特征在于,所述设备(100)还包括解码器(201),用于对所述低维数据(103)进行解码,以及将所述低维数据(103)与所述输入数据(101)进行比较,以测量重建损失并调整所述自动编码单元(102)的操作参数,从而最小化重建损失。

7.根据上述权利要求中任一项所述的设备(100),其特征在于,所述聚类单元(104)还用于获得每个集群(105)的质心参数。

8.根据权利要求7所述的设备(100),其特征在于,所述聚类单元(104)还用于根据集群的质心参数确定数据点分配到的集群。

9.根据上述权利要求中任一项所述的设备(100),其特征在于,所述聚类单元(104)还用于应用第二函数,以最小化数据点的成对相似度并提高所述数据点的可分离性。

10.根据权利要求9所述的设备(100),其特征在于,所述第二函数与所述第一函数应用相同的相似度度量,具体是数据点的余弦相似度。

11.根据上述权利要求中任一项所述的设备(100),其特征在于,所述聚类单元(104)还用于最小化与不同集群(105)关联的数据点的相似度。

12.根据上述权利要求中任一项所述的设备(100),其特征在于,所述聚类单元(104)还用于最大化与同一个聚类(105)关联的数据点的相似度。

13.根据上述权利要求中任一项所述的设备(100),其特征在于,在所述第二阶段中,所述设备(100)还用于:根据所述聚类单元(104)的操作参数优化所述自动编码单元(102)的操作参数,以及根据所述自动编码单元(102)的操作参数优化所述聚类单元(104)的操作参数。

14.根据权利要求13所述的设备(100),其特征在于,所述设备(100)还用于同时优化所述自动编码单元(102)的操作参数和所述聚类单元(104)的操作参数。

15.一种用于对输入数据(101)进行聚类的方法(300),其特征在于,所述输入数据(101)为包括数据点的数据集,所述方法(300)包括以下步骤:

-在设备(100)的第一操作阶段中,自动编码单元(102)降低(301)所述输入数据(101)的维度,以及/或者所述自动编码单元(102)从所述输入数据(101)中提取(301)与聚类相关的特征,从而产生低维数据(103);

-在所述设备(100)的第二操作阶段中,聚类单元(104)根据所述低维数据(103)获得(302)至少一个集群(105),以及所述聚类单元(104)将所述低维数据(103)中的每个数据点(302)与至少一个集群(105)中的一个集群关联,

其中,所述自动编码单元(102)优化所述低维数据(103),以对所述低维数据(103)进行无损重建。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201880093500.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top