[发明专利]基于监控视频的非法遛狗事件检测方法、装置有效
申请号: | 202110492720.4 | 申请日: | 2021-05-07 |
公开(公告)号: | CN112906678B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 杨帆;冯帅;刘利卉;胡建国 | 申请(专利权)人: | 南京甄视智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 杨楠 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监控 视频 非法 事件 检测 方法 装置 | ||
1.一种基于监控视频的非法遛狗事件检测方法,其特征在于,包括以下步骤:
步骤A、对监控视频的图像帧进行狗和人的检测,如图像帧中没有检测到狗,则判断“状态正常”并返回;如果图像帧中只有狗没有人,则判断“狗未拴绳”并返回;否则,进入步骤B;
步骤B、估算图像帧中人与狗之间的距离并判断是否超过预设距离阈值,如是,则判断“狗未拴绳”并返回;否则,进入步骤C;
步骤C、从图像帧中截取包含狗的图像并输入狗拴绳识别模型,如狗拴绳识别模型的输出为“狗已拴绳”或“狗未拴绳”,则将结果输出并返回;否则,进入步骤D;所述狗拴绳识别模型为预先训练好的卷积神经网络模型,其输入为含有狗的图像,其输出为“狗已拴绳”、“狗未拴绳”及“不确定”这三个类别;所述从图像帧中截取的包含狗的图像具体为第一感兴趣区域图像和第二感兴趣区域图像,第一感兴趣区域图像为狗的检测框图像,第二感兴趣区域图像为对狗的检测框图像进行扩边所得到的图像;所述卷积神经网络模型具有两个训练样本输入分支,第一个分支用于对第一感兴趣区域图像先进行若干次卷积,然后沿卷积通道方向池化,最后将其归一化指数处理为注意力特征图;第二个分支用于对第二感兴趣区域图像先进行若干次卷积,得到与注意力特征图的尺度大小相同的多通道特征图,并用注意力特征图分别与该多通道特征图的每个通道特征图相乘,然后对所得结果进行至少一次卷积后依次进行池化、线性化及归一化指数处理;第一个分支使用包含小幅度旋转和视角变换在内的数据扩增方式训练,第二个分支使用不包含小幅度旋转和视角变换的数据扩增方式训练;
步骤D、从图像帧中找出距离狗最近的k个人,对每个人截取出同时包含狗和这个人的最大检测框,k为大于0的自然数;将所得到的k个检测框图像输入人狗关系识别模型,并根据人狗关系识别模型的输出判断“狗已拴绳”或者“狗未拴绳”;所述人狗关系识别模型为预先训练好的神经网络模型,其输入为同时包含狗和人的图片,其输出为“狗已拴绳”或者“狗未拴绳”这两个类别。
2.如权利要求1所述基于监控视频的非法遛狗事件检测方法,其特征在于,所述卷积神经网络模型为可重构卷积网络模型。
3.如权利要求1所述基于监控视频的非法遛狗事件检测方法,其特征在于,所述对狗的检测框图像进行扩边具体是指:对狗的检测框图像的上边和左、右两边进行扩边。
4.如权利要求1~3任一项所述基于监控视频的非法遛狗事件检测方法,其特征在于,所述扩边的比例为15%-20%。
5.如权利要求1所述基于监控视频的非法遛狗事件检测方法,其特征在于,所述人狗关系识别模型由前端的局部和初步特征提取模块以及后端的全局人狗关系注意力模块组成;所述局部和初步特征提取模块用于对输入图像进行若干次卷积,所得到的特征图作为全局人狗关系注意力模块的输入;所述全局人狗关系注意力模块为改进的Vision Transformer模型,其对所输入的特征图进行有重叠的分割。
6.如权利要求1所述基于监控视频的非法遛狗事件检测方法,其特征在于,用以下方法估算图像帧中人与狗之间的距离:用人与狗之间的像素水平距离除以人检测框的宽度,再乘以基准人体宽度;所述基准人体宽度的取值为0.25米~0.5米。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京甄视智能科技有限公司,未经南京甄视智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110492720.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于位图的考勤标识算法
- 下一篇:一种真空精密铸造模组自动化转运系统