[发明专利]一种应用于监控设备的行为识别方法在审
申请号: | 202310588003.0 | 申请日: | 2023-05-24 |
公开(公告)号: | CN116665299A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 葛君正;段强;姜凯 | 申请(专利权)人: | 山东浪潮科学研究院有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/52;G06V20/40;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 监控 设备 行为 识别 方法 | ||
本发明涉及计算机视觉技术领域,具体为一种应用于监控设备的行为识别方法,包括以下步骤:步骤1:获取数据集;步骤2:视频预处理和数据增强;步骤3:网络搭建;步骤4:网络训练;步骤5:网络测试;步骤6:量化;步骤7:模型部署;有益效果为:本发明提出的应用于监控设备的行为识别方法,使用的MobilnetV2网络和GRU单元的参数量和计算量低,保证精度的前提下减少了边缘设备的推理时间,方便在监控设备上实时对盗窃动作进行快速识别。
技术领域
本发明涉及计算机视觉技术领域,具体为一种应用于监控设备的行为识别方法。
背景技术
现有技术中,时空卷积神经网络(3D-CNN)是一种基于2D卷积神经网络(CNN)的模型,它可以处理时序视频数据,并在时空域上执行卷积操作。它要求输入视频序列的长度相同,因此不适用于实时视频流,而且需要较大的计算资源和内存来处理视频数据。长短时记忆网络(LSTM)是一种循环神经网络,可以对时序数据进行建模,并通过记忆单元来处理长时间依赖关系,在处理动态场景时表现优异,但存在网络参数量较大的问题。
发明内容
本发明的目的在于提供一种应用于监控设备的行为识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种应用于监控设备的行为识别方法,所述行为识别方法包括以下步骤:
步骤1:获取数据集;
步骤2:视频预处理和数据增强;
步骤3:网络搭建;
步骤4:网络训练;
步骤5:网络测试;
步骤6:量化;
步骤7:模型部署。
优选的,获取数据集时,获取监控设备记录下的多个盗窃视频,包含偷窃和商店盗窃或更多其他盗窃种类,使用视频剪辑工具,基于25fps的采样率,选择出最能代表盗窃行为的10秒长的视频片段保存,作为数据集中的盗窃类的视频。
优选的,视频预处理和数据增强时,统一所有视频片段的采样率和尺寸。
优选的,网络搭建时,通过将视频分解为一系列的图像帧,并将每帧作为CNN的输入,输出一系列特征向量,然后使用RNN层对提取出的特征序列进行处理完成分类。
优选的,网络训练时,使用步骤2处理后的训练集和验证集,与步骤3得到的模型进行训练。
优选的,网络测试时,对步骤4训练后的网络在测试集上进行测试,评估模型性能,确定可以量化的模型。
优选的,量化时,将步骤5得到的模型导出生成ONNX模型文件,然后根据要使用的硬件,使用相应的软件库对ONNX模型进行INT8量化。
优选的,模型部署时,将步骤6得到的量化后的模型,生成C语言代码文件,部署到嵌入式开发板。
与现有技术相比,本发明的有益效果是:
本发明提出的应用于监控设备的行为识别方法,使用的MobilnetV2网络和GRU单元的参数量和计算量低,保证精度的前提下减少了边缘设备的推理时间,方便在监控设备上实时对盗窃动作进行快速识别。
附图说明
图1为本发明方法流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310588003.0/2.html,转载请声明来源钻瓜专利网。