[发明专利]一种具有类人连续学习能力的图像目标识别系统及方法有效
申请号: | 201911180534.6 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110991513B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 吴俊君;邝辉宇;周林 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 窦军雷 |
地址: | 528231 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 连续 学习 能力 图像 目标 识别 系统 方法 | ||
本发明公开了一种具有类人连续学习能力的图像目标识别系统及方法,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;本发明具有可以有效提高神经网络模型的连续学习能力,能够适应多类别的小样本连续学习,为后来得出的网络权重分类更加精确;本发明还可以对需要进行多种单一类别样本的训练学习的目标识别方法精度进行提高,应用本发明的正交权重修改算法实现了对网络现有知识的有效保护,并且与现有的梯度反向传播算法完全兼容,在连续学习任务中精度得到很好地提升。
技术领域
本发明涉及目标视觉检测、目标识别、深度学习领域,具体而言,一种具有类人连续学习能力的图像目标识别系统及方法。
背景技术
目标检测在现实生活中可以应用在安全领域、军事领域、交通领域、医疗领域和生活领域中,而物体目标识别是计算机视觉的四个基本任务之一,目前在目标检测领域中主要应用深度神经网络进行实现,根据深度学习神经网络处理后所得出的神经网络模型对图像中的目标进行检测。
由于目前在深度学习领域中需要通过对同一类物体经过神经网络学习之后应用于识别、分类和预测。在采用现有的深度学习神经网络算法(如faster RCNN、YOLO v3等算法)对于输入图片进行学习后,所得到的神经网络模型会固定下来,很难再去学习新的信息,在实际场景中不足以具有上下文信息,很难满足复杂和不断变化的需求,缺乏依赖于语境的学习,同时受到了在灾难性遗忘的问题困扰,在保留旧知识的同时,很难学习新知识。因此急需提出一种能够解决灾难性遗忘问题的图像目标识别系统及方法。
发明内容
本发明的目的在于提供一种具有类人连续学习能力的图像目标识别系统及方法以解决所述问题。
为实现上述目的,本发明所提供的一种具有类人连续学习能力的图像目标识别系统及方法,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;
所述神经网络预训练模块,用于将一类图像经过深度学习神经网络学习训练后得到一个神经网络模型权重;
所述图像输入模块,用于对图像进行预处理,为图像中的物体对象类型添加标签;
所述神经网络模块,用于根据预训练的神经网络模型对图像的中的每一个同一类别的对象进行特征提取,同时再通过池化层将图片尺寸还原至原输入图片的尺寸大小;
所述正交权重修改模块,用于在学习新的类别图像任务时,在与旧任务输入空间正交的方向上修改神经网络权重;
所述分类器模块,用于利用分类器网络对经过深度学习的所述神经网络模块和所述正交权重修改模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记。
优选的是,所述正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播(backpropagationn BP)计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
利用Softmax分类器网络对经过深度学习神经网络模块和OWM模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记。
另外,本发明还公开了一种具有类人连续学习能力的图像目标识别系统的使用方法,其特包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911180534.6/2.html,转载请声明来源钻瓜专利网。