[发明专利]样本选择方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202110475560.2 申请日: 2021-04-29
公开(公告)号: CN113077015A 公开(公告)日: 2021-07-06
发明(设计)人: 钱江;钟志权;庄伯金 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 深圳国新南方知识产权代理有限公司 44374 代理人: 周雷
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 选择 方法 装置 计算机 设备 存储 介质
【权利要求书】:

1.一种样本选择方法,其特征在于,包括:

将多个待标注样本输入至预训练的深度神经网络模型中进行目标检测,以得到每一所述待标注样本中目标检测物对应的目标特征以及所述目标特征对应的所属类别;

对所述待标注样本中同一类别的目标特征进行聚类,得到每一所述类别对应的多个类簇;每一所述类簇对应一聚类中心;

计算同一所述待标注样本对应的所述目标特征与每一所述聚类中心的距离,将所述距离作为每一所述目标特征对应的特征距离;

基于同一所述待标注样本对应的多个所述特征距离,计算所述待标注样本的样本得分;

根据每一所述待标注样本的样本得分,确定目标标注样本。

2.如权利要求1所述样本选择方法,其特征在于,在所述基于多个所述特征距离,计算所述待标注样本的样本得分之后,所述样本选择方法还包括:

若所述待标注样本中存在所述目标特征的特征距离在对应的所述类簇内最小,则按照预设减分规则,在所述样本得分的基础上降低所述样本得分,得到更新后的样本得分;

所述根据每一所述待标注样本的样本得分,确定目标标注样本,包括:

根据更新后的每一所述待标注样本的样本得分,确定目标标注样本。

3.如权利要求1所述样本选择方法,其特征在于,所述基基于同一所述待标注样本对应的多个所述特征距离,计算所述待标注样本的样本得分,包括:

对同一所述待标注样本对应的多个特征距离进行取均值处理,将均值处理的结果作为所述待标注样本的样本得分。

4.如权利要求1所述样本选择方法,其特征在于,在所述对所述待标注样本中同一类别的目标特征进行聚类,得到每一所述类别对应的多个类簇之前,所述样本选择方法还包括:

获取每一所述类别对应的目标特征的特征数量以及计划标注样本的计划数量;

根据所述特征数量以及所述计划数量,确定所述类别对应的类簇数量;

所述对所述待标注样本中同一类别的目标特征进行聚类,得到每一所述类别对应的多个类簇,包括:采用K-means算法对所述待标注样本中同一类别的目标特征进行聚类,得到每一所述类别对应的所述类簇数量个类簇。

5.如权利要求1所述样本选择方法,其特征在于,所述根据每一所述待标注样本的样本得分,确定目标标注样本,包括:

按照从小到大的顺序对每一所述待标注样本的样本得分进行排序,并选取排在前N位的所述待标注样本作为所述目标标注样本。

6.如权利要求1所述样本选择方法,其特征在于,所述按照预设减分规则,在所述样本得分的基础上降低所述样本得分,得到更新后的样本得分,包括:按照预设减分公式,在所述样本得分的基础上降低所述样本得分,得到更新后的样本得分;其中,所述预设减分公式为:Z=s*0.9p;其中,Z表示所述更新后的样本得分,s表示未更新前的样本得分,P表示所述待标注样本中存在P个所述目标特征的特征距离在对应的所述类簇内最小。

7.如权利要求4所述样本选择方法,其特征在于,所述采用K-means算法对所述待标注样本中同一类别的目标特征进行聚类,得到每一所述类别对应的所述类簇数量个类簇,包括:

根据所述类簇数量初始化所述K-means算法的K值;

将所述同一类别的目标特征作为待聚类样本,从所述待聚类样本中随机选取K个所述目标特征作为聚类中心,并更新所述待聚类样本;

基于特征相似度,从更新后的待聚类样本中选取与所述聚类中心对应的多个目标特征;其中,所述特征相似度用于指示所述更新后的待聚类样本中的目标特征与所述聚类中心之间的相似度;

更新所述聚类中心,并重复执行所述基于特征相似度,从更新后的待聚类样本中选取与所述聚类中心对应的多个目标特征的步骤,直到满足预设算法终止条件,得到所述类别对应的K个类簇。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110475560.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top