[发明专利]一种具有类人连续学习能力的图像目标识别系统及方法有效
申请号: | 201911180534.6 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110991513B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 吴俊君;邝辉宇;周林 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 窦军雷 |
地址: | 528231 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 连续 学习 能力 图像 目标 识别 系统 方法 | ||
1.一种具有类人连续学习能力的图像目标识别系统,其特征在于,其包括神经网络预训练模块、图像输入模块、神经网络模块、正交权重修改模块和分类器模块;
所述神经网络预训练模块,用于将一类图像经过深度学习神经网络学习训练后得到一个神经网络模型权重;
所述图像输入模块,用于对图像进行预处理,为图像中的物体对象类型添加标签;
所述神经网络模块,用于根据预训练的神经网络模型对图像的中的每一个同一类别的对象进行特征提取,同时再通过池化层将图片尺寸还原至原输入图片的尺寸大小;
所述正交权重修改模块,用于在学习新的类别图像任务时,在与旧任务输入空间正交的方向上修改神经网络模型权重;
所述分类器模块,用于利用分类器网络对经过深度学习的所述神经网络模块和所述正交权重修改模块的图片中的每一类别的对象进行分类,找出图片中每一种类别对象所处的位置并用方框进行标记;
所述正交权重修改模块通过训练学习所引起的权重修改公式为:
BP
ΔW=kPΔW
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
2.根据权利要求1所述的具有类人连续学习能力的图像目标识别系统,其特征在于,所述分类器网络为Softmax。
3.如权利要求1~2任一项的具有类人连续学习能力的图像目标识别系统的使用方法,其特征在于,包括以下步骤:
步骤1:对同一类别的图像样本进行处理,对于同一类别对象的图像经过深度学习神经网络得到预训练神经网络模型权重;
步骤2:提取图像的物体特征类别信息,利用深度学习神经网络的卷积层提取图像中的物体对象特征;
步骤3:利用金字塔池化层,对具有多个卷积核池化的深度学习神经网络获得固定大小的feature maps;并根据输入的图片将ROI映射到feature map对应位置,然后将映射后的区域划分为相同大小的选择框,然后对每个选择框进行最大值池化操作,从不同的大小的方框的中得到相应的特征值;
步骤4:利用两个全连接层,对图像中的每一个候选区域作用对于图像中的特征区域进行提取,把在卷积层中得到的所有局部特征组合成全局特征;
步骤5:利用正交权重修改模块,对在图像经过前向传播后得出与预训练模型的相差值进行反向传播,更新权值,重新计算输出;
步骤6:利用分类层,对于深度学习神经网络模型输出每一个分类对象的概率,输出一个确定的变量;
步骤7:得到含有目标对象检测选择框的图像;
所述正交权重修改模块通过训练学习所引起的权重修改公式为:
ΔW=kPΔWBP
其中ΔWBP为根据预训练神经网络模型权重所得到的标准反向传播计算的权重调整所得到,k是神经网络的学习速率为常数,而P则是构造坐标系用于找到与输入空间正交的方向,P的计算公式为:
P=I-A(ATA+aI)-1A
其中矩阵A包含所有先前训练过的输入向量作为列输入,而I是单位矩阵乘以相对较小的常数a,AT指的是A的转置矩阵的值。
4.根据权利要求3所述的具有类人连续学习能力的图像目标识别方法,其特征在于,所述深度学习神经网络为VGG16或ResNet。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911180534.6/1.html,转载请声明来源钻瓜专利网。