[发明专利]一种基于k近邻图的稀有类检测方法及装置在审
申请号: | 201910213519.0 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109948705A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 李易;黄浩;李宗鹏 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于k近邻图的稀有类检测方法,首先,对于给定未标签数据集S构造其k近邻图,其中k值由算法自动选取;然后基于构造的k近邻图,给定变化系数Vc的定义,对数据集中的每一个节点计算其变化系数Vc值。接着从所有节点中找出变化系数最大的节点x,并向贴标者询问得到其类别标签y,并分别将x与y加入所选数据样本集合I与所选数据样本真实类别标签集合L中。本发明利用检测数据集中数据样本分布的局部突变的方法来进行稀有类检测,和其余的无先验稀有类检测方法相比,KRED方法效率更高,算法开销较低。同时通过自动选取k值的方法,有效提高了数据集中各个类的发现效率,并显著减少了发现数据中全部类所需要的询问次数。 | ||
搜索关键词: | 数据样本 检测 变化系数 类别标签 数据集中 自动选取 集合 先验 标签数据 给定变化 检测数据 节点计算 算法开销 询问 贴标 算法 突变 发现 | ||
【主权项】:
1.一种基于k近邻图的稀有类检测方法,其特征在于,包括:对于预设给定未标签数据集S,构造其k近邻图;基于构造的k近邻图,设置节点p的变化系数Vc的定义,Vc(p)=maxV(p)×std(EL(p)),![]()
其中,kNN(p)表示p的k个最近邻节点集合,EL(p)表示节点p的边长集合,deg(p)为k近邻图中点p的入度,并基于设置的变化系数的定义,计算出数据集S中每个节点对应的变化系数值;从所有节点中找出变化系数最大的节点x,并获得其类别标签y,再分别将x与y加入预先选取的数据样本集合I与数据样本真实类别标签集合L中,从而找出稀有类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910213519.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种交易监测方法与装置
- 下一篇:模型训练方法、装置、终端及存储介质