[发明专利]一种视频物体识别的方法、装置、设备以及存储介质在审
申请号: | 201910104597.7 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109815931A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 黄国恒;黄斯彤;胡可;张挥谦 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图像 第一空间 目标图像 图像 计算机可读存储介质 感兴趣区域 第二空间 视频物体 网络算法 截取 视频 读取 存储介质 目标物体 区域特征 视频图像 物体分割 下采样 算法 | ||
1.一种视频物体识别的方法,其特征在于,包括:
读取待识别的视频,截取所述视频的当前帧的图像;
利用FCN网络算法对所述当前帧的图像进行下采样处理,得到所述当前帧的图像的第一空间特征图像;
利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像;
将所述目标图像输入至所述FCN网络算法,计算得到所述目标图像的第二空间特征图像,以便于根据所述第二空间特征图像,识别所述当前帧的图像内的目标物体。
2.如权利要求1所述的方法,其特征在于,所述读取待识别的视频,截取所述视频的当前帧的图像包括:
调用视频接口读取所述待识别的视频,在所述视频时长t分钟内每隔n秒截取一帧图像,从而得到60t/n帧待处理的图像;
获取所述当前帧的图像,以便于利用所述FCN网络算法对所述当前帧的图像进行下采样处理。
3.如权利要求1所述的方法,其特征在于,所述利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像包括:
利用ROI Align算法对所述第一空间特征图像进行处理,得到所述第一空间特征图内的感兴趣区域,以便于在所述第一空间特征图内截取所述感兴趣区域内的目标图像。
4.如权利要求3所述的方法,其特征在于,所述利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像后还包括:
利用基于对象上下文的场景分割网络,预测所述目标图像内各个像素所属对象的类别,并利用图像金字塔结构为所述目标图像内的各个类别设置标签。
5.如权利要求3所述的方法,其特征在于,所述利用基于对象上下文的场景分割网络,预测所述目标图像内各个像素所属对象的类别,并利用图像金字塔结构为所述目标图像内的各个类别设置标签前还包括:
依据所述当前帧的图像的上一副图像在长期短期记忆网络内的记忆内容,对所述目标图像内的像素进行比对与校正。
6.一种视频物体识别的装置,其特征在于,包括:
第一截取模块,用于读取待识别的视频,截取所述视频的当前帧的图像;
下采样模块,用于利用FCN网络算法对所述当前帧的图像进行下采样处理,得到所述当前帧的图像的第一空间特征图像;
第二截取模块,用于利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像;
识别模块,用于将所述目标图像输入至所述FCN网络算法,计算得到所述目标图像的第二空间特征图像,以便于根据所述第二空间特征图像,识别所述当前帧的图像内的目标物体。
7.如权利要求6所述的装置,其特征在于,所述第一截取模块具体用于:
调用视频接口读取所述待识别的视频,在所述视频时长t分钟内每隔n秒截取一帧图像,从而得到60t/n帧待处理的图像;
获取所述当前帧的图像,以便于利用所述FCN网络算法对所述当前帧的图像进行下采样处理。
8.如权利要求6所述的装置,其特征在于,所述第二截取模块具体用于:
利用ROI Align算法对所述第一空间特征图像进行处理,得到所述第一空间特征图内的感兴趣区域,以便于在所述第一空间特征图内截取所述感兴趣区域内的目标图像。
9.一种视频物体识别的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述一种视频物体识别的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述一种视频物体识别的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910104597.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序