[发明专利]视频数据抽取方法、装置、电子设备及存储介质有效
申请号: | 202110883346.0 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113672763B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 韩立伟;熊世林 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 杜欣;卢万腾 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据 抽取 方法 装置 电子设备 存储 介质 | ||
本申请涉及一种视频数据抽取方法、装置、电子设备及存储介质,所述方法包括:首先获取视频数据池中每个视频数据对应的样本标识以及待抽取数量,然后基于预设的验证算法,依次对样本标识进行验证,若验证结果符合预设随机抽取条件,将当次验证的样本标识确定为目标样本标识,直至确定出待抽取数量的目标样本标识,最后从视频数据池中抽取与目标样本标识对应的视频数据。基于此,由于本申请中是依次对样本标识进行验证,因此无需数组的参与,也无需数组中元素的挪动,可以降低时间复杂度。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种视频数据抽取方法、装置、电子设备及存储介质。
背景技术
随着数据时代的到来,数据量迎来了爆炸式的增长,尤其是互联网公司,每天都会产生大量的数据,而公司产品运营时,有时会对数据进行检查,由于数据量巨大,只能利用软件随机抽取小部分数据进行检查。
目前,为了抽取m个样本,首先会将样本池中每个样本的唯一样本标识全部加载到内存中,并放到一个顺序存储的数组中,假设样本池中有n个样本,那么就会得到一个大小为n的数组,每个样本标识会作为数组中的一个元素,在抽取视频时,随机生成一个0到n+1-i(i表示此时正在抽取第i个样本)之前的随机整数,然后从数组中取出以该随机整数为数组下标的元素中的样本标识,该样本标识对应的样本就是随机抽取到的第i个样本,然后将抽取到的样本标识从数组中移除,并移动数组中的其他元素,以填补移除的元素的位置,以便于下一次的抽取。
上述抽取样本的过程中,每次抽取完样本后,都会顺次移动数组中的其他元素,来填补移除元素的位置,抽取m个样本,就需要对数组进行m次顺次移动,由于单次顺次移动就具有一定的时间复杂度,那么上述抽取样本过程中,顺次移动所带来的时间复杂度可能就会成倍增加,而且抽取的样本数量越多,时间复杂度越高,抽取过程耗费的时间就越长。
发明内容
为克服相关技术中存在的抽取的样本数量越多,时间复杂度越高,抽取过程耗费的时间就越长的问题,本申请提供一种视频数据抽取方法、装置、电子设备及存储介质。
根据本申请的第一方面,提供一种视频数据抽取方法,包括:
获取视频数据池中每个所述视频数据对应的样本标识以及待抽取数量;
基于预设的验证算法,依次对所述样本标识进行验证,若验证结果符合预设随机抽取条件,将当次验证的样本标识确定为目标样本标识,直至确定出待抽取数量的目标样本标识;
从所述视频数据池中抽取与所述目标样本标识对应的视频数据。
在一个可选的实施方式中,所述基于预设的验证算法,依次对所述样本标识进行验证,若验证结果符合预设随机抽取条件,将当次验证的样本标识确定为目标样本标识,直至确定出待抽取数量的目标样本标识,包括:
在对当次验证的样本标识进行验证的情况下,确定当前待验证的样本标识的数量以及当前剩余待抽取数量;
若当前待验证的样本标识的数量大于或等于所述当前剩余待抽取数量,基于预设的验证算法对当次验证的样本标识进行验证,并判断验证结果是否符合预设随机抽取条件;
若验证结果符合预设随机抽取条件,将当次验证的样本标识确定为目标样本标识,进行对下一样本标识的验证;
若验证结果不符合所述随机抽取条件,直接进行对下一样本标识的验证若当前剩余待抽取数量为0,停止对所述样本标识进行验证的过程。
在一个可选的实施方式中,所述基于预设的验证算法对当次验证的样本标识进行验证,并判断验证结果是否符合预设随机抽取条件,包括:
按照预设的随机数获取算法获取随机数,将所述随机数作为对当次验证的样本标识进行验证的验证结果,并判断验证结果是否符合预设随机抽取条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110883346.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置