[发明专利]一种智能划区的站台工作人员的识别方法在审
申请号: | 202011485426.2 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112528885A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 张祥祥;沈修平 | 申请(专利权)人: | 上海悠络客电子科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 徐伟奇 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 站台 工作人员 识别 方法 | ||
1.一种智能划区的站台工作人员识别方法,其特征在于,步骤如下:
步骤一 采集行人数据,并人工打标分类;
步骤二 使用步骤一人工打标好的数据,用卷积神经网络训练行人分类模型;
步骤三 颜色过滤器:首先图片由BGR转换成HSV空间,然后根据警戒线的颜色分别确定H、S、V,的取值范围,取值为:11H26,S43或S255,V46或V255,把不同时在H、S、V取值范围内的值置零;
步骤四 对经过颜色过滤器后的图片做显著性检测,自动精确提取警戒线区域maskI,使用的算法为SOD100K(Highly Efficient Salient Object Detection with 100KParameters),该算法提出的轻量级网络主要由特征提取器和跨阶段的融合部分组成,可同时处理多个尺度的特征;特征提取器与SOD100K提出的层内多尺度块堆叠在一起,并根据特征图的分辨率分为4个阶段,每个阶段分别具有3、4、6和4个层内多尺度块;SOD100K提出的一种灵活的卷积模块(gOctConvs)组成的跨阶段融合部分会处理来自特征提取器各阶段的特征以获得高分辨率的输出;
该算法使用一种新型的动态权重衰减方案来减少特征表示的冗余性,可以根据某些通道的特定特征来调整权重衰减;具体来说,在反向传播期间,衰减项会根据某些通道的特征动态变化;动态权重衰减的权重更新可表示为:
其中λd是动态权重衰减的权重,xi表示由wi计算的特征,而S(xi)是特征的度量,根据任务可以具有多个定义,wi是第i层的权重,是要更新的梯度;在该算法中,目标是根据稳定通道之间的特征进行权重分配,使用全局平均池化作为特定通道的指标,公式可表示为:
xi表示特征图,H,W分别表示特征图的高和宽;
步骤五 根据警戒线区域maskI勾画出封闭的多边形警戒区域,并把封闭区域内像素值设置为255,区域外像素值全部设置为0,得到maskⅡ;
步骤六 对原图和步骤五中的maskⅡ取图像的与操作图,得到目标区域图片;
步骤七 对步骤六中所得到的目标区域图片使用基于深度学习的方法yolov4(OptimalSpeed and Accuracy of Object Detection)做行人检测,若有行人,则得到对应的行人检测框bbox,yolov4算法是一种通用的目标检测算法,该算法主要的特征是目标检测的精度高速度快,其主要使用的损失函数为CIoU,可表示为:
其中,
b,bgt分别代表anchor框和目标框的中心点,ρ(·)表示欧式距离,c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离,ω,h分别表示预测框的宽和高,ωgt,hgt分别为真实框的宽和高;
步骤八 对步骤七中得到的行人框bbox,提取对应的行人图片;
步骤九 使用预先训练好的行人分类网络模型对行人图片做分类识别,得到识别结果为非工作人员,或者工作人员的种类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海悠络客电子科技股份有限公司,未经上海悠络客电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011485426.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆盘剪刃倒角磨削装置
- 下一篇:电极连接装置