[发明专利]一种视频物体识别的方法、装置、设备以及存储介质在审
申请号: | 201910104597.7 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109815931A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 黄国恒;黄斯彤;胡可;张挥谦 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图像 第一空间 目标图像 图像 计算机可读存储介质 感兴趣区域 第二空间 视频物体 网络算法 截取 视频 读取 存储介质 目标物体 区域特征 视频图像 物体分割 下采样 算法 | ||
本发明公开了一种视频物体识别的方法、装置、设备以及计算机可读存储介质,包括:读取待识别的视频,截取所述视频的当前帧的图像;利用FCN网络算法对所述当前帧的图像进行下采样处理,得到所述当前帧的图像的第一空间特征图像;利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像;将所述目标图像输入至所述FCN网络算法,计算得到所述目标图像的第二空间特征图像,以便于根据所述第二空间特征图像,识别所述当前帧的图像内的目标物体。本发明所提供的方法、装置、设备以及计算机可读存储介质,提高了视频图像内物体分割的准确性。
技术领域
本发明涉及计算机视觉视频检测技术领域,特别是涉及一种视频物体识别的方法、装置、设备以及计算机可读存储介质。
背景技术
计算机视觉在当今科技发展中占有重要意义,图像和视频识别更是被用到各行各业中,如安防,自动驾驶,医疗成像中。因此不断地追求识别的精度有着十分重要的意义。
现有技术中视频物体识别方法对于图像内边缘不够清晰,形状尺寸在输入的图像之间占据相对较小的区域的物体会存在被错误分割或者不分割的问题。
综上所述可以看出,如何提高视频图像内物体分割的准确性是目前有待解决的问题。
发明内容
本发明的目的是提供一种视频物体识别的方法、装置、设备以及计算机可读存储介质,以解决现有技术中对于视频图像内边缘不清晰,形状尺寸占比较小的物体存在被错误分割或不分割的问题。
为解决上述技术问题,本发明提供一种视频物体识别的方法,包括:读取待识别的视频,截取所述视频的当前帧的图像;利用FCN网络算法对所述当前帧的图像进行下采样处理,得到所述当前帧的图像的第一空间特征图像;利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像;将所述目标图像输入至所述FCN网络算法,计算得到所述目标图像的第二空间特征图像,以便于根据所述第二空间特征图像,识别所述当前帧的图像内的目标物体。
优选地,所述读取待识别的视频,截取所述视频的当前帧的图像包括:
调用视频接口读取所述待识别的视频,在所述视频时长t分钟内每隔n秒截取一帧图像,从而得到60t/n帧待处理的图像;
获取所述当前帧的图像,以便于利用所述FCN网络算法对所述当前帧的图像进行下采样处理。
优选地,所述利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像包括:
利用ROI Align算法对所述第一空间特征图像进行处理,得到所述第一空间特征图内的感兴趣区域,以便于在所述第一空间特征图内截取所述感兴趣区域内的目标图像。
优选地,所述利用区域特征聚集算法对所述第一空间特征图像进行处理,得到所述第一空间特征图像内的感兴趣区域,截取所述感兴趣区域内的目标图像后还包括:
利用基于对象上下文的场景分割网络,预测所述目标图像内各个像素所属对象的类别,并利用图像金字塔结构为所述目标图像内的各个类别设置标签。
优选地,所述利用基于对象上下文的场景分割网络,预测所述目标图像内各个像素所属对象的类别,并利用图像金字塔结构为所述目标图像内的各个类别设置标签前还包括:
依据所述当前帧的图像的上一副图像在长期短期记忆网络内的记忆内容,对所述目标图像内的像素进行比对与校正。
本发明还提供了一种视频物体识别的装置,包括:
第一截取模块,用于读取待识别的视频,截取所述视频的当前帧的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910104597.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序