[发明专利]扩充数据集的方法、装置、设备及计算机存储介质在审
申请号: | 201711135279.4 | 申请日: | 2017-11-14 |
公开(公告)号: | CN108875765A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 张思朋 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/08 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;刘爱平 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 图像序列 计算机存储介质 时间序列 图像添加 预测 图像 保证 | ||
本发明实施例提供了一种扩充数据集的方法、装置、设备及计算机存储介质。该方法包括:基于当前数据集获取行人图像序列;根据所述行人图像序列预测位于所述行人图像序列的时间序列之后的至少一个行人图像;将所述预测的至少一个行人图像添加到所述当前数据集以生成新的数据集。由此可见,本发明实施例能够基于当前数据集生成包括更多数据的新的数据集,从而实现了对数据集的扩充。进一步地,该扩充的数据集可以用于重识别模型,以保证重识别模型的准确性。
技术领域
本发明涉及图像处理领域,更具体地涉及一种扩充数据集的方法、装置、设备及计算机存储介质。
背景技术
行人、车辆等的重识别(re-identification,ReID),是安防、行人追踪、车辆追踪等众多领域的基础。行人及车辆追踪的效果的一个决定因素是重识别模型的性能,而重识别模型的训练依赖于大量的训练数据,即数据集。若数据集中的数据不足可能会导致模型过拟合,从而无法适应更广泛的应用场景和人群。如果采用人工标注添加相应的数据至数据集,不仅消耗了大量的财力和人力,并且人工标注错误会影响重识别模型的准确性。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种扩充数据集的方法、装置、设备及计算机存储介质,能够基于当前数据集生成包括更多数据的新的数据集,从而实现了对数据集的扩充。
根据本发明的一方面,提供了一种扩充数据集的方法,所述方法包括:
基于当前数据集获取行人图像序列;
根据所述行人图像序列预测位于所述行人图像序列的时间序列之后的至少一个行人图像;
将所述预测的至少一个行人图像添加到所述当前数据集以生成新的数据集。
在本发明的一个实施例中,所述根据所述行人图像序列预测位于所述行人图像序列的时间序列之后的至少一个行人图像,包括:
将所述行人图像序列中的至少一帧图像输入至训练好的预测网络,得到位于所述行人图像序列的时间序列之后的所述至少一个行人图像。
在本发明的一个实施例中,所述预测网络通过以下方式进行训练:
获取当前层的目标特征,其中所述当前层的目标特征为所述行人图像序列中连续多帧图像的每一帧图像的下一帧图像的实际特征或者所述当前层的目标特征为前一层所确定的目标特征;
将所述行人图像序列中的连续多帧图像作为输入序列,预测所述连续多帧图像的每一帧图像的下一帧图像特征;
计算所述当前层的目标特征与所述预测的下一帧图像特征之间的误差;
根据所述误差确定下一层的目标特征。
在本发明的一个实施例中,所述计算所述当前层的目标特征与所述预测的下一帧图像特征之间的误差,包括:
计算所述误差为:
其中,Al表示所述当前层的目标特征,表示所述预测的下一帧图像特征,b表示偏置,l表示所述当前层。
在本发明的一个实施例中,所述预测网络的总误差为所述各层的误差的加权和,其中第l层的权重表示为:
L为总层数。
在本发明的一个实施例中,所述基于当前数据集获取行人图像序列,包括:
提取所述当前数据集中的行人图像数据,所述行人图像数据包括由特定采集装置采集的特定人在特定时间段内的图像;
对所述行人图像数据进行预处理操作,得到所述行人图像序列。
在本发明的一个实施例中,所述预处理操作包括以下至少一项:添加随机噪声、翻转、归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711135279.4/2.html,转载请声明来源钻瓜专利网。