[发明专利]基于通路融合的图像识别方法、装置及存储介质在审

专利信息
申请号: 202110262494.0 申请日: 2021-03-10
公开(公告)号: CN115082873A 公开(公告)日: 2022-09-20
发明(设计)人: 汪韬;张睿欣;陈星宇;李绍欣;李季檩;黄飞跃 申请(专利权)人: 腾讯云计算(北京)有限责任公司
主分类号: G06V20/56 分类号: G06V20/56;G06V10/44;G06V10/80;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;杜维
地址: 100190 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 通路 融合 图像 识别 方法 装置 存储 介质
【说明书】:

本申请公开了一种属于人工智能领域下属的计算机视觉技术和机器学习的基于通路融合的图像识别方法、装置及存储介质,该方法包括:获取待识别图像,并通过图像识别模型中的共享卷积层提取待识别图像的图像特征。通过图像识别模型中的第一批归一化层以及第二批归一化层获取图像特征对应的第一归一化图像特征以及第二归一化图像特征。通过图像识别模型中的通路特征融合模块获取上述图像特征对应的第一权重和第二权重。基于上述第一归一化图像特征、上述第一权重、上述第二归一化图像特征以及上述第二权重确定待识别图像的融合特征,并基于上述融合特征确定待识别图像的图像类别。采用本申请,可以提高图像识别的准确度,操作简单,适用性高。

技术领域

本申请涉及计算机技术领域,尤其涉及一种基于通路融合的图像识别方法、装置及存储介质。

背景技术

深度学习目前已经在许多视觉任务中得到广泛应用,例如图像分类、图像检测以及人脸识别等。现阶段中,深度学习模型应用在实际业务中时,攻击者可以通过给正常样本添加人的视觉/听觉无法感知的噪声对模型输入进行更改,从而篡改模型输出,尤其是在刷脸验证等直接涉及消费身份验证的场景,如果深度学习模型的鲁棒性不够高,则会带来很大的安全性风险。

本申请的发明人在研究和实践的过程中发现,针对深度学习模型的风险问题,现有技术通过使用可调节对抗训练(Once-for-all Adversarial Training,OAT)来训练深度学习模型,根据不同业务场景的风险程度,人工设定权衡参数用以对模型的自然精度(正常样本的准确率)和对抗精度(对抗样本的准确率)进行权衡。比如,在风险较大、安全性需求较高的场景中设定较大的权衡参数,此时模型的自然精度较低但对抗精度较高;在风险较小、安全性需求较低的场景中设定较小的权衡参数,此时模型的自然精度较高但对抗精度较低。然而,在实际场景中,业务情况可能随时间产生较大的差异,因此固定的权衡参数难以适应变更的业务场景。此外,引入权衡参数后,在风险较小、安全性需求较低的场景中设定较小的权衡参数,可以使自然精度损伤较低但相应的模型鲁棒性并不高,因此模型鲁棒性与自然精度之间仍存在不一致问题,从而使模型对图像的识别精确度低,适用性差。

发明内容

本申请实施例提供一种基于通路融合的图像识别方法、装置及存储介质,可以提高图像类别的识别准确度,操作简单,适用性高。

本申请实施例第一方面提供一种基于通路融合的图像识别方法,包括:

获取待识别图像,将上述待识别图像输入图像识别模型,并通过上述图像识别模型中的共享卷积层提取上述待识别图像的图像特征;

通过上述图像识别模型中的第一批归一化层获取上述图像特征对应的第一归一化图像特征,并通过上述图像识别模型中的第二批归一化层获取上述图像特征对应的第二归一化图像特征,上述第一批归一化层以及上述第二批归一化层分别由不同噪声强度的样本图像训练得到;

通过上述图像识别模型中的通路特征融合模块获取上述图像特征对应的第一权重和第二权重,上述第一权重用于标记上述第一归一化图像特征所占的权重,上述第二权重用于标记上述第二归一化图像特征所占的权重,上述第一权重和上述第二权重之和为1;

基于上述第一归一化图像特征、上述第一权重、上述第二归一化图像特征以及上述第二权重确定上述待识别图像的融合特征,并基于上述融合特征确定上述待识别图像的图像类别。

结合第一方面,在一种可能的实施方式中,将上述待识别图像输入图像识别模型之前,上述方法还包括:

获取包括至少三种噪声强度的至少三种第一样本图像,将各第一样本图像输入上述图像识别模型,并通过上述图像识别模型中的共享卷积层提取上述各第一样本图像的样本图像特征;

根据上述各第一样本图像的样本图像特征对上述图像识别模型中的至少三个批归一化层进行训练,以得到训练后的至少三个批归一化层,其中,一种噪声强度的样本图像的样本图像特征用于训练一个批归一化层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司,未经腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110262494.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top