[发明专利]基于改进卷积神经网络的对象检测装置及方法有效
申请号: | 201711096143.7 | 申请日: | 2017-11-09 |
公开(公告)号: | CN107944442B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 曾建平;王军;王正;余旭;李党 | 申请(专利权)人: | 北京智芯原动科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100101 北京市朝阳区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 卷积 神经网络 对象 检测 装置 方法 | ||
1.基于改进卷积神经网络的对象检测装置,其特征在于,该装置包括:
标记图像采集模块,用于采集已标记对象的标记图像;
对象检测模型训练模块,用于采用随机采样法,对改进卷积神经网络进行初步训练,获取初步分类的正样本和负样本,以及对应的分类概率值,再根据分类概率值,选择一定比例的正样本和负样本,对改进卷积神经网络进行训练,获取训练好的对象检测模型;
待检测图像输入模块,用于输入待检测图像;以及
对象检测模块,用于采用对象检测模型对待检测图像进行对象检测,输出检测结果;
其中,所述改进卷积神经网络包括:
图像输入模块,用于输入图像;
特征子网络模块,用于对不同尺度的分辨率图像分别进行卷积、非线性单元和池化处理,以获得不同尺度的分辨率特征图像;
建议子网络模块,用于对不同尺度的分辨率特征图像进行锚子网络处理和分析,获取图像内对象的建议窗口的位置坐标和分类概率值;
进一步地,所述建议子网络模块包括:
特征图像输入模块,用于输入第三卷积层第三输出层conv3_3、第四卷积层第三输出层conv4_3、第五卷积层第三输出层conv5_3、第六卷积层第二输出层conv6_2、第七卷积层第二输出层conv7_2、第八卷积层第二输出层conv8_2、第九卷积层第二输出层conv9_2、第十卷积层第二输出层conv10_2的特征图像;锚子网络处理模块,用于采用8个锚子网络对输入的8个特征图像分别进行处理,输出8个对应特征图像的锚窗口的先验位置坐标、分类概率值和修正位置坐标;锚子网络分析模块,用于根据锚窗口的先验位置坐标计算锚窗口的先验长度和先验宽度,根据锚窗口的修正位置坐标计算锚窗口的修正长度和修正宽度,按照修正公式对锚窗口进行修正,获取锚窗口的预测窗口,并对锚窗口的预测窗口做非极大值抑制,获取建议窗口的位置坐标和分类概率值并输出。
2.如权利要求1所述的装置,其特征在于,所述对象检测模型训练模块进一步包括:
随机采样处理模块,用于分别将标记图像内的每个标记对象缩放到设定的尺度范围内,并根据该缩放比例对标定图像进行采样处理,以获取该标记对象的尺度图像;
样本获取模块,用于根据不同的尺度图像,对改进卷积神经网络进行训练,获取一系列标记对象的正样本和负样本,以及对应窗口的分类概率值;
样本选取模块,用于将所有正样本和负样本对应窗口的分类概率值进行排序,选取分类概率值高的前Num1个正样本和分类概率值高的前Num2个负样本;
二次训练模块,用于将选取的Num1个正样本和Num2个负样本输入改进卷积神经网络中,以进行二次训练,获得对象检测模型。
3.如权利要求2所述的装置,其特征在于,所述随机采样处理模块进一步包括:用于计算标记对象的宽度WTO,若T1≤WTO*RS≤T2,RS为缩放比例,获取标记对象的尺度图像,该尺度图像的宽度是标记图像宽度的该尺度图像的高度是标记图像高度的
4.如权利要求3所述的装置,所述T1的取值范围为15~25,T2的取值范围为35~45。
5.如权利要求1所述的装置,其特征在于,所述特征子网络模块包括10个卷积层和9个池化层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智芯原动科技有限公司,未经北京智芯原动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711096143.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种扫描式翻译笔
- 下一篇:一种基于端到端深度学习进行对象一致性检测方法