[发明专利]一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法有效
| 申请号: | 202210863953.5 | 申请日: | 2022-07-20 |
| 公开(公告)号: | CN115393892B | 公开(公告)日: | 2023-08-04 |
| 发明(设计)人: | 周欣欣;孟炫宇;张龙;衣雪婷;郭月晨;薛青常;李茂源;杨峰 | 申请(专利权)人: | 东北电力大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/20;G06V10/762;G06V10/764;G06V10/766;G06V10/80;G06V10/82;G06T7/73 |
| 代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 郝姗姗 |
| 地址: | 132012 吉*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 改进 候选 交叉 替换 策略 损失 函数 拥挤 场景 行人 检测 方法 | ||
本发明提供了一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,包括以下步骤:S1:将图像输入到主干网络,提取不同尺度下的特征;S2:将步骤S1提取的特征输入到基于简化CIoU和K‑means聚类算法的锚框优化方法的双锚框区域建议网络中获取候选框;S3:采用改进的双候选框交叉替换策略对步骤S2生成的候选框对进行比对、替换,生成高质量候选框对;S4:将经过RoI Align后的头部和全身候选框对应的特征输入全连接层进行融合,并得到特征图信息;S5:采用改进的损失函数对融合后的特征图信息进行分类和回归处理,预测行人的位置和类别信息;S6:剔除冗余预测框,输出带有最优预测框的图像。该方法有效降低了拥挤场景下行人检测的误检率和漏检率。
技术领域
本发明涉及目标检测技术领域,具体涉及一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法。
背景技术
行人检测这些年一直受到众多研究者的关注,可以为一些现实场景提供重要的技术支持。例如,在车辆驾驶系统中,帮助车辆在行驶过程中检测行人,从而辅助车辆行驶规避行人,减少交通事故发生;在智能监控系统中,通过监控视频或图片的内容,识别罪犯、拥挤行人等潜在的安全隐患,从而及时采取行动,提高居民和城市安全;在机器人以及高级人机交互系统中,赋予机器智能,解放工人双手。此外,行人检测也是多目标追踪、人体姿态估计和人像搜索的前提。
近年来,随着人民物质生活水平的逐渐提高和城市化进程的不断加快,城市居民数量得到了迅速的增长,导致许多场景经常会出现人群拥挤情况,如商场、车站、街道、医院、景区等场景,这些拥挤场景存在着较大的安全隐患。尽管现有行人检测模型在KITTI、CityPersons和Caltech等经典行人检测数据集上取得了不错的结果,但是在拥挤场景数据集上依然表现不佳。与一般行人检测相比,在拥挤场景下,行人检测除了受到图像中光照强度不一、背景复杂多样、不同拍摄角度等因素的影响外,人体结构之间的相似性、姿态的多样性、尺度大小在图像中多变以及行人着装各异等因素,也大大增加了人体检测的难度。更困难的是人体之间还普遍存在高度遮挡,这些遮挡的模式多样且属于同类别遮挡,使得行人检测模型提取的每个目标的特征区分性不高,导致模型无法区分各目标之间的边界,以致将多个目标看作一个整体,或者某些目标的预测边界框有较大偏差,或者预测的边界框被非极大值抑制剔除,进而导致检测模型存在漏检和误检情况,使模型检测效果严重下降。因此,研究拥挤场景行人检测方法,提高行人识别的准确性及定位的精确性,具有较好的理论意义以及实际应用价值。
发明内容
本发明提供了一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,其目的在于解决在拥挤场景下由于人体间的遮挡导致行人检测模型存在漏检和误检的问题。为实现上述目的,本发明提供了如下的技术方案:
一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,具体步骤如下:
S1:将图像输入到主干网络,提取不同尺度下的特征;
S2:将步骤S1中提取的特征输入到基于简化CIoU和K-means聚类算法的锚框优化方法的双锚框区域建议网络中获取候选框;
S3:采用改进的双候选框交叉替换策略对步骤S2生成的候选框对进行比对、替换,生成包含头部和全身候选框的高质量候选框对;
S4:将经过RoI Align后的头部和全身候选框对应的特征输入全连接层进行融合,生成融合后的特征图信息;
S5:根据目标内容对融合后的特征图信息,采用基于改进的损失函数对融合后的特征图信息进行分类和回归处理,获得多个预测框,预测行人的位置和类别信息,其中改进的回归损失函数计算公式见公式(1):
LE-RepLoss=LE-Attr-α*LE-RepGT-β*LE-RepBox (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北电力大学,未经东北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210863953.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能厨房系统
- 下一篇:一种大动态范围地空瞬变电磁探测接收系统及方法





