[发明专利]用于检测目标的方法和装置在审
申请号: | 201810055231.0 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108197623A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 杜康 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/00;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标帧图像 差值图像 方法和装置 目标检测 融合图像 掩膜图像 检测 检测结果 前帧图像 语义分割 视频 图像 融合 申请 | ||
1.一种用于检测目标的方法,包括:
获取待检测视频中的目标帧图像以及位于所述目标帧图像之前且与所述目标帧图像连续相邻的M个前帧图像,其中,M为正整数;
连接M个差值图像,得到连接差值图像,其中,所述M个差值图像是所述目标帧图像与所述M个前帧图像中各个前帧图像的差值图像;
对所述连接差值图像进行语义分割,得到差值掩膜图像,其中,所述差值掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征所述目标帧图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;
融合所述目标帧图像和所述差值掩膜图像,得到融合图像,以及将所述融合图像输入至预先训练的目标检测模型,得到与所述目标帧图像对应的检测结果图像,其中,所述检测结果图像的中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示所述目标帧图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征所述目标帧图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,所述目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。
2.根据权利要求1所述的方法,其中,所述融合所述目标帧图像和所述差值掩膜图像,得到融合图像,包括:
将所述M个前帧图像和所述目标帧图像输入至预先训练的图像对齐模型,得到与所述目标帧图像对应的对齐后图像,其中,所述图像对齐模型用于表征M个待调整图像和调整基准图像二者与将M个待调整图像对齐到调整基准图像后的图像之间的对应关系;
融合所述对齐后图像和所述差值掩膜图像,得到所述融合图像。
3.根据权利要求2所述的方法,其中,所述连接M个差值图像,得到连接差值图像,包括:
将所述目标帧图像输入至预先训练的第一卷积神经网络,得到目标帧特征图像,其中,所述第一卷积神经网络用于提取图像特征;
对于所述M个前帧图像中的每个前帧图像,将该前帧图像输入至所述第一卷积神经网络,得到该前帧图像的特征图像,以及将所述目标帧特征图像与该前帧图像的特征图像的差值图像确定为该前帧图像的差值图像;
连接所述M个前帧图像中各前帧图像的差值图像,得到连接差值图像。
4.根据权利要求3所述的方法,其中,所述对所述连接差值图像进行语义分割,得到差值掩膜图像,包括:
将所述连接差值图像输入至预先训练的第二卷积神经网络,得到所述差值掩膜图像,其中,所述第二卷积神经网络用于对图像进行语义分割。
5.根据权利要求4所述的方法,其中,所述将所述M个前帧图像和所述目标帧图像输入至预先训练的图像对齐模型,得到与所述目标帧图像对应的对齐后图像,包括:
将所述M个前帧图像中的每个前帧图像的特征图像和所述目标帧特征图像输入至所述图像对齐模型,得到与所述目标帧图像对应的对齐后特征图像;以及
所述融合所述对齐后图像和所述差值掩膜图像,得到所述融合图像,包括:
融合所述对齐后特征图像和所述差值掩膜图像,得到所述融合图像。
6.根据权利要求5所述的方法,其中,所述融合所述对齐后特征图像和所述差值掩膜图像,得到所述融合图像,包括:
将所述对齐后特征图像和所述差值掩膜图像对应像素点的数据的乘积作为所述融合图像中对应像素点的数据;或者
将对所述对齐后特征图像中的像素点按照所述差值掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为所述融合图像中对应像素点的数据;或者
将所述对齐后特征图像中的像素点所包括的数据和所述差值掩膜图像中对应像素点所包括的N个初始置信度作为所述融合图像中对应像素点的数据。
7.根据权利要求6所述的方法,其中,所述将所述M个前帧图像中的每个前帧图像的特征图像和所述目标帧特征图像输入至所述图像对齐模型,得到与所述目标帧图像对应的对齐后特征图像,包括:
将所述M个前帧图像中的每个前帧图像的特征图像和所述目标帧特征图像输入至预先训练的第三卷积神经网络,得到与所述目标帧图像对应的对齐后特征图像,其中,所述第三卷积神经网络用于对齐图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810055231.0/1.html,转载请声明来源钻瓜专利网。