[发明专利]采样方法、装置、电子设备和存储介质在审
申请号: | 202210786592.9 | 申请日: | 2022-07-04 |
公开(公告)号: | CN115147593A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 王威;李林超;周凯;张腾飞 | 申请(专利权)人: | 浙江啄云智能科技有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 赵翠香 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采样 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种采样方法、装置、电子设备和存储介质。具体包括:获取包括不同类型样本的样本集合,并确定样本集合中各样本的困难因子;根据各困难因子,生成不同类型的样本区域簇;根据困难因子、不同类型样本的样本数量和不同类型样本区域簇的数量,确定各类型的样本的需求数量;根据需求数量,对不同类型的样本进行采样。本申请实施例的技术方案,通过将样本集合中的各样本进行区域簇的划分,再确定需要采集的样本的需求数量,从不同的区域簇中采集样本,这样做可以实现难例分层采样,因此采样的结果更具备代表性,保证了采样样本的丰富性,有助于目标检测模型的训练。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种采样方法、装置、电子设备和存储介质。
背景技术
随着计算机视觉技术的发展,越来越多的领域开始使用基于目标检测的图像处理和识别技术。并且,在机器学习飞速发展的当下,通过训练机器学习模型进行图片中目标的识别成为了趋势。在模型训练时,需要使模型学习各种样本,但是在样本的采样过程中容易出现不同种类的样本数量不均衡的情况,导致模型的性能不足。
当前,技术人员利用难例挖掘采样器或IoU(Intersection over Union,交并比)平衡采样器等,使样本的采样更加平衡。但是随着采样的增多,容易出现样本偏向问题,造成某种类型的样本数量较少,不利于模型的训练。
发明内容
本申请提供了一种采样方法、装置、电子设备和存储介质,以平衡不同类型样本的数量。
根据本申请的一方面,提供了一种采样方法,所述方法包括:
获取包括不同类型样本的样本集合,并确定样本集合中各样本的困难因子;
根据各困难因子,生成不同类型的样本区域簇;
根据困难因子、不同类型样本的样本数量和不同类型样本区域簇的数量,确定各类型的样本的需求数量;
根据需求数量,对不同类型的样本进行采样。
根据本申请的另一方面,提供了一种采样装置,包括:
困难因子确定模块,用于获取包括不同类型样本的样本集合,并确定样本集合中各样本的困难因子;
区域簇确定模块,用于根据各困难因子,生成不同类型的样本区域簇;
需求数量确定模块,用于根据困难因子、不同类型样本的样本数量和不同类型样本区域簇的数量,确定各类型的样本的需求数量;
采样模块,用于根据需求数量,对不同类型的样本进行采样。
根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例所述的采样方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本申请任一实施例所述的采样方法。
本申请实施例的技术方案,通过将样本集合中的各样本进行区域簇的划分,再确定需要采集的样本的需求数量,从不同的区域簇中采集样本,这样做可以实现难例分层采样,因此采样的结果更具备代表性,保证了采样样本的丰富性,有助于目标检测模型的训练。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江啄云智能科技有限公司,未经浙江啄云智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210786592.9/2.html,转载请声明来源钻瓜专利网。