[发明专利]多标记分类方法、装置、介质及计算设备在审
申请号: | 201710493622.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107316063A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 翁伟;朱顺痣;钟瑛;李建敏 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 厦门市精诚新创知识产权代理有限公司35218 | 代理人: | 何家富 |
地址: | 361000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及机器学习技术领域,尤其涉及多标记分类方法、装置、介质及设备。本申请实施例中,得到各标记的原始正例集和原始负例集后,通过类对齐,确定特定属性和插入相关标记的特定属性的操作,实现了用特定属性来表示标记之间的相关关系,以便于丰富各标记的数据和语义。故此,多标记分类相对于现有技术单纯采用单标记的方法将更加准确。例如,“沙漠”和“骆驼”具有相关关系,将以骆驼为主含有少量沙漠的图片能够分类到沙漠图片中;再例如,一张图片包含的傍晚的湖水,若湖水中具有夕阳的倒影,现有技术只会将该图片分类到湖水中,但湖水中太阳的倒影又与夕阳相关,则采用本申请的方案,还可以将该图片分类到傍晚景色的分类中。 | ||
搜索关键词: | 标记 分类 方法 装置 介质 计算 设备 | ||
【主权项】:
一种多标记分类方法,其特征在于,所述方法包括:针对标记集合中的每个标记,确定该标记的原始正例集和原始负例集;其中,针对每个样本,若该样本具有该标记,则该样本属于该标记的原始正例集,否则,该样本属于该标记的原始负例集;对各标记的原始正例集和原始负例集分别进行类对齐,得到各标记的类对齐后的正例集和类对齐后的负例集;其中,各标记的类对齐后的正例集中样本数量相等、且各标记的类对齐后的负例集中样本数量相等;根据预先确定的聚类中心个数,基于聚类分析方法确定每个类对齐后的正例集的聚类中心,以及每个类对齐后的负例集的聚类中心;针对每个标记,计算该标记的原始正例集和原始负例集中每个样本相对于该标记的各聚类中心的距离,将得到的距离按序排列后作为该标记的与相应样本对应的特定属性,并以该标记的每个样本的特定属性为元素构成该标记的特定属性集合;针对每个标记,将与该标记具有相关关系的其它标记的特定属性插入到该标记的特定属性集合中;基于各标记的特定属性集合,进行分类训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710493622.6/,转载请声明来源钻瓜专利网。