[发明专利]一种用于行人检测的协同式深度网络模型方法有效
申请号: | 201611166903.2 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106650806B | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 王文敏;松鸿蒙;王荣刚;李革;董胜富;王振宇;李英;赵辉;高文 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 行人 检测 协同 深度 网络 模型 方法 | ||
本发明公布了一种用于行人检测的协同式深度网络模型方法,包括:构建一种新的协同式多模型学习框架来完成行人检测中的分类过程;利用人工神经元网络来整合协同式模型中各子分类器的判决结果,并借用机器学习的方法训练该网络,能够更加有效地综合各分类器反馈的信息;提出一种基于K‑means聚类算法的重采样方法,增强协同模型中各分类器的分类效果,进而提升整体分类效果。本发明通过建立协同式深度网络模型,将由聚类算法得到的不同类型的训练数据集用于并行地训练多个深度网络模型,再通过人工神经元网络将原始数据集在各个深度网络模型上的分类结果进行整合和综合分析,以实现更加精准的样本分类。
技术领域
本发明属于信息技术领域,涉及数字文件内容保护技术,尤其涉及一种用于行人检测的协同式深度网络模型方法。
背景技术
无论是自然科学研究还是社会科学研究,人类自身一直是其中最重要的关注对象,因此,利用计算机分析人类活动一直是计算机视觉领域中最热门的研究课题。而人类动作识别和事件检测等智能化行为的分析都需要以快速准确的行人检测为前提,因而行人检测技术的研究日益受到学术界和工业界的广泛关注,对现代视频监控、智能机器人和无人驾驶技术的发展均具有深远意义。一般来说,行人检测是指判断给定图像或视频帧中是否包含行人,如果包含,并标出行人位置的过程,因而可以分为样本的分类和定位两大部分。其中,快速准确的样本分类是行人检测技术的前提和关键。
现有的行人检测技术已较为成熟,其基本框架来源于HOG+SVM模型。其中,行人样本的分类大致分为样本收集(候选框提取)、预处理、特征提取、分类器训练和测试五个主要步骤。其中,特征提取和分类器训练是影响检测性能的关键。按照分类过程所使用分类器数目的多少,行人检测算法可以分为单分类器模型算法和多分类器模型算法。在第一类中,基于人工特征的检测算法和基于深度学习的检测算法占据主流。前者先用人工定义的方法从图像中提取特征,包括HOG特征、LBP特征、ACF等,再送入常用分类器中进行训练,最后利用训练好的模型去区分行人和非行人样本。后来,深度学习算法的出现大大提高了特征提取的准确性和分类器的检测性能,但仍然受限于单个分类器在特征学习能力上的局限性,其结果仍未达到理想水平。第二类算法成功突破了单分类器模型的瓶颈,它们使用多个分类器去学习样本特征,并将各分类结果整合在一起,实现了更加精准的分类效果,如常用的基于部件模型的分类算法、级联模型和集成模型等。基于部件的模型往往从样本的各个部分出发,提取局部特征,训练局部分类器,最后再整合分析,对于遮挡较为严重的样本能够较好地学习到有用的轮廓特征,从而大大提升了检测性能;级联模型则使用Boosting的思想,将多个分类器顺序排列,然后用不同的样本逐一训练这些分类器,使得它们具备不同的分类能力,其中后一分类器的设计需依据前一分类器的分类结果,最终级联所有的弱分类器形成一个强分类器,从分类器互补的角度改进了检测算法的性能;集成模型则是多分类器模型中较为罕见的一类,在行人检测领域尚未被人关注和使用,它采用并行的方式来整合多个分类器,让所有子分类器共同完成最终的决策,这与人类社会协同合作的决策方式极其相似。目前在行人检测领域成功得到验证和应用的集成模型仅有集成CNN(Convolutional Neural Network,卷积神经元网络)模型,它并行地训练多个CNN模型,然后将每个样本输入各CNN模型,最后取输出的得分中最大、最小或平均值作为该样本的最终分类结果。基于集成CNN模型的分类算法具体过程包括:
1)准备训练数据集,用滑动窗口法从原始数据集中提取多尺度的行人和非行人候选框;
2)将每个样本依次送入CNN进行卷积和pooling计算,得到特征图;
3)采用不同的dropout比例设置全连接层,然后将从原始样本中提取的特征图送入训练不同的CNN模型;
4)将测试数据集依次送入训练好的模型中进行行人样本的分类,每个样本均得到若干检测得分,计算得分的最大、最小或平均值作为最终的判别得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611166903.2/2.html,转载请声明来源钻瓜专利网。