[发明专利]面向变化场景的远红外行人检测方法在审

申请号：	201410338632.9	申请日：	2014-07-16
公开（公告）号：	CN104239907A	公开（公告）日：	2014-12-24
发明（设计）人：	刘琼;庄家俊;申旻旻	申请（专利权）人：	华南理工大学
主分类号：	G06K9/66	分类号：	G06K9/66
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍
地址：	511400 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向变化场景红外行人检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及行人检测技术领域，具体为一种面向变化场景的远红外行人检测方法。

背景技术

训练数据与测试数据之间通常存在不可避免的数据分布差异性，这是导致多数基于机器学习的远红外行人检测方法在场景因素变化较大时表现得不够理想的主要原因之一。具体来说，一般行人检测方案中采用的传统机器学习算法默认满足下述基本假设：训练数据和测试数据独立同分布，即训练数据和测试数据通常来源于相似甚至相同的场景。当这个基本假设得不到满足的时候，这类基于传统机器学习算法的远红外行人检测方案通常难以成功应用。

然而，在针对不同应用场合的行人检测系统中，由于测试视频数据中潜在的场景差异性，训练数据和测试数据之间存在的数据分布差异性通常难以避免。产生这类差异性的主要因素包括：不同的气候条件(行人衣着和/或环境随温度的改变而改变，由此将影响行人散发的热辐射能量、以及热辐射能量被远红外摄像头接吸收的幅度)以及、不同的摄像头配置方案(如视角的变化将显著影响目标的外观模式)等。因此，为了适时应对新场景中潜在的未知远红外行人模式，需要从新场景中重新收集规模充足的训练数据(规模不充分的训练数据容易造成过拟合问题从而影响分类器的泛化能力)，重新训练适合新场景的行人分类器。但是这种传统方案需要标记足够多的适时训练数据而存在高标记成本问题，而且当其他新场景出现时，这种无止境的高代价方案明显阻碍高效率远红外行人检测系统的建立。此外，直接抛弃原来已有的大量训练数据(即辅助数据)亦造成了资源的浪费。

以提高新场景中的行人检测性能作为学习目标，出现了大量致力于各种自适应学习算法的研究。各种在线学习或增量学习策略被用于离线更新行人分类器。这类方案大多利用从辅助数据中学习得到的行人分类器，在指定的新场景中搜索检测置信度较高的目标模式(包括行人模式和背景模式)组成扩展样本集，以对行人分类器进行在线更新或者重新训练，达到在指定新场景中准确识别/检测远红外行人目标的目的。例如，Wang等(Wang X Y,Hua G,Han T X.Detection by detections:non-parametric detector adaptation for a video.Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,2012)提出一种基于非参数估计的行人分类器自适应调整方法，建立基于层次c均值聚类的词汇树模型收集高置信度的检测结果，并利用它们对其余低置信度的检测结果进行排序和重组，进而获取扩展样本集。Sharma等(Sharma P,Huang C,Nevatia R.Unsupervised incremental learning for improved object detection in a video.Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,2012)对行人分类器获得的检测结果进行跟踪，将检测结果与跟踪结果进行匹配，正确匹配者视为新场景中表征行人模式的样本，否则视为表征背景模式的样本。上述方法的优点在于无需预先进行标记新场景中的目标模式，但可能面临两个重要问题：(1)扩展样本集中的样本可能包含数据标记的噪声，直接采用带噪声的扩展样本集难以保证更新后的行人分类器的可靠性；(2)当行人分类器泛化能力较差时，通常无法处理或收集新场景中不能被正确检测的行人模式，因为这类行人模式并未包含在辅助数据中，也即无法通过学习获取其信息，难以保证更新后的分类器能够有效识别新场景中的各种行人模式。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410338632.9/2.html，转载请声明来源钻瓜专利网。

上一篇：激光调节机构
下一篇：基于模糊粒子群和目标分解的极化SAR图像分类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向变化场景的远红外行人检测方法在审

专利文献下载