[发明专利]基于多场景的以图搜图测试方法、装置、产品及存储介质在审
申请号: | 202111575760.1 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114565936A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 田煜;李凡平;石柱国 | 申请(专利权)人: | 以萨技术股份有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/776;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 青岛发思特专利商标代理有限公司 37212 | 代理人: | 赵伟敏 |
地址: | 272061 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 场景 图搜图 测试 方法 装置 产品 存储 介质 | ||
本申请涉及深度学习与人工智能技术领域,公开一种基于多场景的以图搜图测试方法,包括从数据库中选取同一类别的数据获得初始数据组,从所述初始数据组中选取检索数据组;通过测试脚本中的LOAD_DATA方法将所述初始数据组和所述检索数据组的数据加载进内存;通过改进RepVGG算法提取所述检索数据组的数据中的特征;对所述特征进行比对获得测试结果;输出所述测试结果生成测试报表。该方法提高了再次测试的效率,使得原有的算法模型在特定场景中的实用性更高,提升了特征提取精度。本申请还公开一种基于多场景的以图搜图测试装置、产品及存储介质。
技术领域
本申请涉及深度学习与人工智能技术领域,例如涉及一种基于多场景的以 图搜图测试方法、装置、产品及存储介质。
背景技术
目前,互联网上图像的数据信息日渐庞大,用户对图像搜索的要求也在不 断提高,行人重识别(Person re-identification)也称行人再识别,是利用计算机 视觉技术判断图像或者视频序列中是否存在特定行人的技术。
现有的以图搜图测试方案中,通常采用ReID算法进行。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
由于实际场景较多较杂,现有的ReID算法无法较好地适应特定的场景。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。 所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例 的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种基于多场景的以图搜图测试方法装置、产品及存 储介质,以解决多场景应用的技术问题。
在一些实施例中,所述方法包括:
从数据库中选取同一类别的数据获得初始数据组,所述初始数据组的数量 范围为[50,150]万组;
从所述初始数据组中选取检索数据组,所述检索数据组的数量范围为[20,60]组,其中,每组所述检索数据组包括数量范围为[10,30]张的图片,所述图片包 括不完全相同的角度、摄像头和点位;
通过测试脚本中的LOAD_DATA方法将所述初始数据组和所述检索数据组 的数据加载进内存;
通过改进RepVGG算法合并部分卷积层和BN层并且增加深度可分离卷积 代替RepVGG算法中部分卷积层后,提取所述初始数据组和所述检索数据组的 数据中的特征;
对所述特征进行比对获得测试结果;
输出所述测试结果生成测试报表。
具体的,所述深度可分离卷积包括深度卷积和点卷积,所述深度可分离卷 积的计算量为:
Dk2*Dp2*M+N*Dp2*M (1),
其中,Dk为卷积核的大小,Dp表示每个卷积核垂直和水平滑动Dp次,N为卷积核 的个数,M为卷积核的通道数。
具体的,所述通过改进RepVGG算法合并部分卷积层和BN层并且增加深 度可分离卷积代替RepVGG算法中部分卷积层后,提取所述初始数据组和所述 检索数据组的数据中的特征,还包括:
将CircleLoss加入RepVGG算法网络中进行训练,所述CircleLoss公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于以萨技术股份有限公司,未经以萨技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575760.1/2.html,转载请声明来源钻瓜专利网。