[发明专利]用于检测目标的方法和装置在审
申请号: | 201810055231.0 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108197623A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 杜康 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/00;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标帧图像 差值图像 方法和装置 目标检测 融合图像 掩膜图像 检测 检测结果 前帧图像 语义分割 视频 图像 融合 申请 | ||
本申请实施例公开了用于检测目标的方法和装置。该方法的一具体实施方式包括:获取待检测视频中的目标帧图像以及位于目标帧图像之前且与目标帧图像连续相邻的M个前帧图像;连接M个差值图像,得到连接差值图像;对连接差值图像进行语义分割,得到差值掩膜图像;融合目标帧图像和差值掩膜图像,得到融合图像,以及将融合图像输入至预先训练的目标检测模型,得到与目标帧图像对应的检测结果图像。该实施方式提高了目标检测的速度。
技术领域
本申请实施例涉及计算机技术领域,具体涉及图像识别技术领域,尤其涉及用于检测目标的方法和装置。
背景技术
视频中的目标检测,即对视频中的各帧图像,检测该帧图像所包括的目标的类别和/或位置信息。现有的对视频中各帧图像进行目标检测方法通常直接在视频的各帧图像的原始图像中进行检测。
发明内容
本申请实施例提出了用于检测目标的方法和装置。
第一方面,本申请实施例提供了一种用于检测目标的方法,该方法包括:获取待检测视频中的目标帧图像以及位于目标帧图像之前且与目标帧图像连续相邻的M个前帧图像,其中,M为正整数;连接M个差值图像,得到连接差值图像,其中,M个差值图像是目标帧图像与M个前帧图像中各个前帧图像的差值图像;对连接差值图像进行语义分割,得到差值掩膜图像,其中,差值掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征目标帧图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;融合目标帧图像和差值掩膜图像,得到融合图像,以及将融合图像输入至预先训练的目标检测模型,得到与目标帧图像对应的检测结果图像,其中,检测结果图像的中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示目标帧图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征目标帧图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。
在一些实施例中,融合目标帧图像和差值掩膜图像,得到融合图像,包括:将M个前帧图像和目标帧图像输入至预先训练的图像对齐模型,得到与目标帧图像对应的对齐后图像,其中,图像对齐模型用于表征M个待调整图像和调整基准图像二者与将M个待调整图像对齐到调整基准图像后的图像之间的对应关系;融合对齐后图像和差值掩膜图像,得到融合图像。
在一些实施例中,连接M个差值图像,得到连接差值图像,包括:将目标帧图像输入至预先训练的第一卷积神经网络,得到目标帧特征图像,其中,第一卷积神经网络用于提取图像特征;对于M个前帧图像中的每个前帧图像,将该前帧图像输入至第一卷积神经网络,得到该前帧图像的特征图像,以及将目标帧特征图像与该前帧图像的特征图像的差值图像确定为该前帧图像的差值图像;连接M个前帧图像中各前帧图像的差值图像,得到连接差值图像。
在一些实施例中,对连接差值图像进行语义分割,得到差值掩膜图像,包括:将连接差值图像输入至预先训练的第二卷积神经网络,得到差值掩膜图像,其中,第二卷积神经网络用于对图像进行语义分割。
在一些实施例中,将M个前帧图像和目标帧图像输入至预先训练的图像对齐模型,得到与目标帧图像对应的对齐后图像,包括:将M个前帧图像中的每个前帧图像的特征图像和目标帧特征图像输入至图像对齐模型,得到与目标帧图像对应的对齐后特征图像;以及融合对齐后图像和差值掩膜图像,得到融合图像,包括:融合对齐后特征图像和差值掩膜图像,得到融合图像。
在一些实施例中,融合对齐后特征图像和差值掩膜图像,得到融合图像,包括:将对齐后特征图像和差值掩膜图像对应像素点的数据的乘积作为融合图像中对应像素点的数据;或者将对对齐后特征图像中的像素点按照差值掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为融合图像中对应像素点的数据;或者将对齐后特征图像中的像素点所包括的数据和差值掩膜图像中对应像素点所包括的N个初始置信度作为融合图像中对应像素点的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810055231.0/2.html,转载请声明来源钻瓜专利网。