[发明专利]一种行人流量检测方法和系统有效
申请号: | 202210454852.2 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114550109B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 李金泽;赵政杰;张舒;张宁 | 申请(专利权)人: | 中国科学院微电子研究所 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/26;G06V10/44;G06V10/54;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京天达知识产权代理事务所(普通合伙) 11386 | 代理人: | 牛洪瑜 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 流量 检测 方法 系统 | ||
本发明涉及一种行人流量检测方法和系统,属于图像预处理及识别技术领域,解决了现有自注意力模型的训练时间超出预期时间及全连接层的二分类效果差等问题。该方法包括:获取预训练图像集、训练图像集和验证图像集,使用数据增广的方式对预训练和训练图像集进行扩增;构建检测模型,检测模型包括自注意力模块和代替全连接层的支撑向量机;使用预训练图像集对检测模型进行预训练;使用训练图像集对预训练后的检测模型进行正式训练,然后使用验证图像集进行验证以生成训练完成的检测模型;获取待检测图像,并将待检测图像发送给训练完成的检测模型以获取识别结果。预训练数据集进行预训练显著减少了训练时间及使用支撑向量机能够提高二分类性能。
技术领域
本发明涉及图像预处理及识别技术领域,尤其涉及一种行人流量检测方法和系统。
背景技术
近年来,随着深度学习的不短发展与突破,深度神经网络在视觉领域取得了不错的成果,识别精度越来越高,而识别方法也趋于相同,大多数的模型都是基于CNN的结构。虽然CNN具有很好的识别精度,但是网络的结构也变得越来越复杂,网络层数由几十层甚至加深到了上百层,在训练难度和计算量方面也都有了不小的提升。动辄上百亿的参数量严重限制了模型部署到嵌入式系统或移动端的应用。
自注意力机制是另一种提取图像特征的方法,不同于CNN使用滑动卷积、堆叠层数的方法获取图像的全局感受野,自注意力机制使用了两个编码器简化了模型,同时基于query、key 、value的方法直接提取出了全局相关性特征。但是自注意力机制网络目前有两点问题:第一点是自注意力机制的训练时间过长的问题,根据谷歌的论文数据,其自注意力模型的训练时间大约是3天(在使用了24块TPU的条件下),这显然大大超出了预期时间;第二点是自注意力模型通常面对的为多分类问题,而面对二分类问题时,仅仅将最后一层全连接层的输出强行修改为2个输出并不能达到很好的效果。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种行人流量检测方法和系统,用以解决现有自注意力模型的训练时间超出了预期时间以及利用全连接层进行二分类效果差等问题。
一方面,本发明实施例提供了一种行人流量检测方法,包括:获取预训练图像集、训练图像集和验证图像集,其中,使用数据增广的方式对所述预训练图像集和所述训练图像集进行扩增;构建检测模型,其中,所述检测模型包括自注意力模块和代替全连接层的支撑向量机;使用扩增后的预训练图像集对所述检测模型进行预训练;使用扩增后的训练图像集对预训练后的检测模型进行正式训练,然后使用所述验证图像集进行验证,以生成训练完成的检测模型;获取待检测图像,并将所述待检测图像发送给训练完成的所述检测模型以获取识别结果。
上述技术方案的有益效果如下:使用预训练数据集进行预训练后再使用训练数据集训练可以显著减少自注意力模型所需要的训练时间,同时并不会降低其性能。相比于传统的训练方法,有了较大的改进。此外,使用支撑向量机来代替最后一层的全连接层,能够极大地提高其二分类性能,进而减少了训练时间和模型规模,同时保证了精度。
基于上述方法的进一步改进,所述预训练图像集为单个行人图像;以及所述训练图像集为人群图像,其中,所述训练图像集的分辨率高于所述预训练图像集的分辨率。
基于上述方法的进一步改进,使用数据增广的方式对所述预训练图像集和所述训练图像集进行扩增包括:使用镜像增广矩阵对所述预训练图像集和所述训练图像集进行扩增以识别图像中不同角度和不同方向的相同目标;以及使用缩放增广矩阵对所述预训练图像集和所述训练图像集进行扩增以识别图像中远近不同的人物和大小不同的场景。
基于上述方法的进一步改进,所述检测模型还包括预处理模块,其中,使用所述预处理模块对扩增后的图像集中的图像进行预处理,以强化图像中目标的边缘特征;使用所述自注意力模块,对预处理后的图像进行特征提取;以及使用所述支撑向量机对所述自注意力模块提取的图像特征进行二分类,其中,在所述预训练过程中所述扩增后的图像集为扩增后的预训练图像集,或者在正式训练过程中所述扩增后的图像集为扩增后的训练图像集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院微电子研究所,未经中国科学院微电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210454852.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:样本分析仪及其急诊检测方法
- 下一篇:一种搅拌性定量盘式给料机