[发明专利]一种基于可回溯目标识别的智能寻物方法及系统在审
申请号: | 202210685950.7 | 申请日: | 2022-06-16 |
公开(公告)号: | CN114973099A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 李玉洁;马子航;丁数学;谭本英 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06T7/73;G06N3/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王宁宁 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 回溯 目标 识别 智能 方法 系统 | ||
本发明提供了一种基于可回溯目标识别的智能寻物方法及系统,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。本发明通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。
技术领域
本发明属于图像处理技术领域,尤其涉及一种基于可回溯目标识别的智能寻物方法及系统。
背景技术
人工智能日益融入人们的日常生活,智能制造如智能摄像头,使其实现高效精确地实现目标识别以寻物的功能对个人、工业领域十分重要。目前,目标识别是计算机视觉领域中的一个重要领域。而基于实时视频进行物品寻找更是该领域中的一项重要任务。
基于目标识别的寻物任务主要是以图像或者视频作为输入,目标识别在图像中找出目标,并确定目标位置。同一图像内的多个目标都能被识别和定位,以实现寻找物品的功能。传统方法实现基于目标识别的寻物任务是深度学习技术,如卷积神经网络,自动学习目标的固有特征以便识别目标。现有的深度学习实现目标识别的方法有两种,一种是从头开始训练模型,另一种是使用迁移学习方法,在有大量的数据支持下,深度学习具有高程度的准确性。
然而,当下的基于目标识别的寻物方法面临着一些问题:一方面,由于应用场景的复杂,不同场景识别的目标大小形状各不相同,背景参数等均有差异,在多样性的应用场景下出现准确率下降,从而泛用性不足。另一方面,基于深度神经网络的解决方案需要大量的训练数据与算力,难于实现实时分析计算并应用到需要实时处理的工程问题中。
发明内容
为解决上述技术问题,本发明提出了一种基于可回溯目标识别的智能寻物方法及系统,通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。
一方面为实现上述目的,本发明提供了一种基于可回溯目标识别的智能寻物方法,包括:
对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;
对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;
提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。
可选地,对所述视频关键帧进行预处理包括:按时间回溯倒叙排列所述视频关键帧。
可选地,对所述场景视频进行稀疏模型建模处理包括:引入行列式约束构成稀疏模型;
所述行列式约束为:
f(H)=max(det(HHT))
其中,H为稀疏矩阵,HT为稀疏矩阵H的转置,det()为行列式。
可选地,构造所述自适应目标字典包括:
对所述自适应目标字典施加正交约束;
将施加正交约束后的所述自适应目标字典进行Cayley变换处理,并加入Barzilai-Borwein步长。
可选地,提取所述视频信号的视频关键帧的方式为:采用关键帧提取模型;
所述关键帧提取模型为:
其中,JGMC(X)为稀疏约束,Y为视频信号矩阵,F为Frobenius范数,为求解最小F范数下参数的取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210685950.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于电弧增材的船用钛合金梯度复合材料制备方法
- 下一篇:一种电力配电柜