[发明专利]基于非对称映射半耦合字典对的低分辨率行人重学习方法有效
申请号: | 201910324340.2 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110032984B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 荆晓远;马飞;訾璐;黄鹤;姚永芳;李娟娟 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 11401 北京金智普华知识产权代理有限公司 | 代理人: | 杨采良 |
地址: | 525000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 映射 低分辨率视频 字典 非对称 分辨率视频 半监督 分辨率 学习 视频 高分辨率视频 低分辨率 高分辨率 视频对象 特征转化 投影矩阵 有效解决 有效应用 重新识别 准确率 场景 清晰 | ||
本发明属于行人重识别技术领域,公开了一种基于非对称映射半耦合字典对的低分辨率行人重学习方法,针对此场景同时学习一对非对称映射,一对高低分辨率视频的字典,以及一个投影矩阵,并利用学习到的映射和字典,将低分辨率视频的特征转化为有鉴别的高分辨率特征,这样既减少了每个视频内的变量,又弥补了高低分辨率视频间的鸿沟,使得不同行人之间的判别更清晰。本发明有效解决了识别中可能存在视频的分辨率不同,特别是根据一个行人的低分辨率视频,需要在高分辨率视频集中重新识别该行人的问题;本发明能够有效应用在分辨率不同的视频对象上,并显著提高行人重识别的准确率。
技术领域
本发明属于行人重识别技术领域,尤其涉及一种基于非对称映射半耦合字典对低分辨率视频重学习方法。
背景技术
目前,最接近的现有技术:
在行人重识别领域,一类基于特征表示的方法,关注的是设计一种鲁棒的、有鉴别力的特征表示并用于匹配。例如,通过利用类别信息来克服同一人的不同图像间外观差异较大的问题,进而建立一种有鉴别力的特征表示模型。另一类基于匹配模型学习的方法,重点关注如何学习一个具有鉴别力的匹配模型,大部分这类方法采用度量学习技术来学习匹配模型。Hirzer等人提出了一种鉴别马氏度量学习方法,该方法从来自于不同摄像头的图像构成的样本对中学习距离度量,并且在经过某些松弛之后该方法可以被高效地解决。最近,字典学习技术也已经被引入到行人重识别中,用来学习匹配模型。例如,通过学习两个耦合的字典来消除摄像头间差异带来的影响。
在提升低分辨率图像的视觉质量方面,学者们提出了一系列超分辨率恢复方法。例如,Yang等人假设存在一对耦合的高、低分辨率字典,使得每一对高、低分辨率图像块在对应字典上具有相同的稀疏表示。
行人重识别在计算机视觉和模式识别领域引发了越来越多的关注,因为在视频监控和取证上的重大作用,使其在近几年得到了广泛的研究。行人重识别是指,根据一个摄像头拍摄的某个行人的一张图像(或一段视频),并从其他摄像头拍摄的图像或视频中重新识别该行人的过程。实际情况中,两个摄像头之间往往存在许多差异和不确定因素,比如光照,视角,距离和硬件质量等等,使得行人重识别成为一项极具挑战性的研究问题。
除此之外,行人重识别还会受到低分辨率视频的影响。由于摄像头质量差、行人距离摄像头较远等因素,摄像头拍摄到的行人视频可能具有较低分辨率。低分辨率视频的行人重识别的场景是:gallery视频集由硬件质量较好的摄像头拍摄,而probe视频由质量较差的摄像头拍摄,这种情况下,gallery视频具有较高的分辨率,而probe视频只有较低的分辨率。现有的行人重识别方法的应用场景大多为静止的图像,这些方法往往通过可视化外观特征(比如色彩,纹理和梯度等)进行匹配,可以分为基于特征学习和基于距离学习的方法两类。
特征学习聚焦于为样本寻找判定性和鲁棒的特征;距离学习目标在于学习判定性的度量,这些度量使得正确匹配的行人之间的距离要比那些错误匹配的距离要小。
由于分辨率降低会造成行人图像中的可视化信息损失,时空特征的计算也基于可视化信息,这意味着现有的行人重识别方法并不能很好地处理高低分辨率视频间的重识别问题。
综上所述,现有技术存在的问题是:
(1)现有的行人重识别方法的应用场景大多为静止的图像,无法对低分辨率行人图像中的可视化信息进行恢复或处理,一些基于视频的行人重识别方法会从行人视频中提取出时空特征,并且利用时空特征进行正常分辨率模式下的匹配,而时空特征的计算也基于可视化信息,同样不能很好地处理超分辨视频重识别问题。
(2)现有的半耦合字典学习方法趋向于处理图像超分辨率恢复任务,但直接将该技术应用到超分辨率行人重识别任务中,由于没有对鉴别项和正则项进行设计,学习到的字典对和映射矩阵可能无法具备良好的鉴别力和高效性。
(3)由于行人视频往往包含有噪声,直接利用半耦合字典学习技术学到的字典对无法很好地刻画高、低分辨率图像之间的本质关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910324340.2/2.html,转载请声明来源钻瓜专利网。