[发明专利]一种基于改进光流法的R-CNN模型及其目标识别方法在审
申请号: | 202011397534.4 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112381093A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 夏荣菲 | 申请(专利权)人: | 集美大学诚毅学院 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 黄淑娟 |
地址: | 361000 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 光流法 cnn 模型 及其 目标 识别 方法 | ||
本发明公开一种基于改进光流法的R‑CNN模型及其目标识别方法,其方法部分包括如下步骤:S1,对收集到的图像利用基于金字塔改进的光流法生成候选区域,同时利用改进型DCNN的卷积层提取特征;S2,利用改进型DCNN的ROI池化层把步骤S1生成的候选区域映射到步骤S1输出的特征图对应位置,并把映射后的区域划分为大小相同尺寸的部分;S3,将图像进行最大池化操作后输入分类器进行分类识别,同时利用回归器修正目标位置。本发明利用了基于金字塔改进的光流法进行候选区域的生成,解决了传统光流法需要假设条件下实现的问题。使得本发明能够对图像中对移动物体进行候选区域的生成。
技术领域
本发明应用于图像识别领域,具体是一种基于改进光流法的R-CNN模型及其目标识别方法。
背景技术
基于传统图像处理和机器学习的目标识别算法是基于手工特征所构建的。该方法一般包括三个阶段:首先在输入图像上选定一些候选区域,候选区域选择是通过具有大小、比例不同的滑动窗口,对整幅输入图像进行遍历来确定目标可能出现的位置;随之,对这些候选区域进行特征提取,常用的特征提取的方法有基于形状、边缘、纹理的特征提取,以及一些更加优异的人工算子;最后再使用训练后的分类器对其进行分类和识别,常用的分类器包括支持向量机、决策树、人工神经网络、Adaboost算法和DPM等,从而得到所需要的目标结果。
深度学习在目标识别领域取得了较为显著的结果[32-34],研究主要的方向为提高目标的识别速度和精度。基于候选区域的目标识别方法不仅降低了算法的复杂度,提高了识别速度,还可以预测出目标可能会出现的位置,但仍存在因候选区域数量过多引起的检测速度慢的问题。因此对于基于候选区域目标识别算法的研究,关键在于如何快速高效的提取候选区域,从而提高网络执行效率。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种基于改进光流法的R-CNN模型及其目标识别方法。
为解决上述技术问题,本发明的一种基于改进光流法的R-CNN模型的目标识别方法,其包括如下步骤:
S1,对收集到的图像利用基于金字塔改进的光流法生成候选区域,同时利用改进型DCNN的卷积层提取特征;
S2,利用改进型DCNN的ROI池化层把步骤S1生成的候选区域映射到步骤S1输出的特征图对应位置,并把映射后的区域划分为大小相同尺寸的部分;
S3,将图像进行最大池化操作后输入分类器进行分类识别,同时利用回归器修正目标位置。
作为一种可能的实施方式,进一步的,所述步骤S1中利用基于金字塔改进的光流法生成候选区域的具体计算过程如下:
I(X)=I(x,y)和J(X)=J(x,y)是相邻两个二维图像的灰度值,在图像中的位置是X=[x y]T,第一帧图像I(X)的角点速度是u=[ux uy]T,则第二帧图像J(X)的角点速度为v=v+u=[ux+dy,uy+dy]T;其中,u=[dxdy]是图像位置X点的速度,即X点的光流值,邻域窗口半径为(w1 w2),取值为2-7的整数,光流误差函数为:
金字塔的层数为L,图像中像素点u在L层的坐标为,其速度定义为:
通过L和L+1层描述下金字塔执行的具体步骤,第L层的初始光流估计值第L层的误差函数EL重新定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于集美大学诚毅学院,未经集美大学诚毅学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011397534.4/2.html,转载请声明来源钻瓜专利网。