[发明专利]基于深度视觉特征和支持向量机的地表纹理识别算法在审
申请号: | 201611163755.9 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106599848A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 沈业;兰超;李雪飞 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 南京理工大学专利中心32203 | 代理人: | 朱宝庆 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 视觉 特征 支持 向量 地表 纹理 识别 算法 | ||
技术领域
本发明涉及一种模式识别技术,特别是一种基于深度视觉特征和支持向量机的地表纹理识别算法。
背景技术
智能车辆技术是一个新兴的学科,融合了计算机、现代传感、信息融合、通讯、人工智能及自动控制等技术,广泛应用于军事、民用领域。在民事领域中,它为驾驶者带来便利的同时,可以有效地避免突发状况的发生,减少交通事故的发生。该技术的第一层技术是智能感知/预警系统,利用各种传感器信息来获得对车辆自身、车辆行驶的周围环境及驾驶员本身的站台感知,必要时发出预警消息,是辅助驾驶系统和车辆自动驾驶系统这后两层技术的基础。
由于智能车不仅在户外的越野环境中行驶时,必须先对地表进行识别,分析道路的变化,然后进行不同的操作从而实现车辆的自主导航。道路大体可以分为结构化道路与非结构化道路,针对道路结构的不同,地表分类的研究也有所不同。在特征提取方面,结构化道路路表的颜色、纹理等特征较为稳定、统一,便于进行针对性的研究,主要通过识别道路线和道路标志的形状来建模分析,目前的研究比较成熟而且有了较大的进展。而非结构化道路的地表分类由于受外界环境影响较大,例如阳光、雨雪、季节对等室外环境下,路表分类的结果就相应较差,仍然处于研究阶段且极具挑战性,亟需不断开拓和完善。
发明内容
本发明的目的在于提供一种基基于深度视觉特征和支持向量机的地表纹理识别算法。本发明能够在已知的户外采集到的地表纹理数据库中,较好地消除阳光、雨雪、季节对等室外环境对非结构化道路的影响,抽取具有稳健性和辨别力的深度视觉特征,并且进行道路分类,分类准确率高。
一种基于深度视觉特征和支持向量机的地表纹理识别算法,包括以下步骤:
步骤1,获取不同种非结构化道路的图片,并将每类图片的一部分存入训练集另一部分存入测试集,训练集和测试集构成地表纹理数据库;
步骤2,采用AlexNet卷积神经网络模型,获取地表纹理数据库所有图像的深度视觉特征并保存;
步骤3,在建立的地表纹理数据库中,对不同种非结构化道路分别定义标签,采用支持向量机算法分析训练集的深度视觉特征得到判决函数,分析测试集的深度视觉特征得到测试集的预测标签和分类准确率;
步骤4,判断准确率是否高于设定值,若高于设定值则保留地表纹理数据库;否则,从新获取不同种非结构化道路的图片。
本发明与现有技术相比,具有以下优点:(1)本发明优点在于基于“Caffe”深度学习框架,采用AlexNet卷积神经网络模型得到地表纹理数据库抽取所有输入图像的深度视觉特征,单个输入图像经过5个卷积层和2个全连接层输出一个4096维的特征向量,较好地消除了阳光、雨雪、季节对等室外环境对非结构化道路的影响,抽取具有稳健性和辨别力的深度视觉特征;(2)利用支持向量机(Support Vector Machine,SVM)算法对深度视觉特征进行分析,进而达到识别地表纹理图像的目的,具有很高的识别准确率。
下面结合说明书附图对本发明做进一步描述。
附图说明
图1为本发明实施例基于深度视觉特征和支持向量机的地表纹理识别算法的流程示意图。
图2为南京理工大学越野地表纹理数据库样本示意图。
图3为卷积神经网络模型结构示意图。
具体实施方式
一种基于深度视觉特征和支持向量机的地表纹理识别算法,其特征在于,包括以下步骤:
步骤1,获取不同种非结构化道路的图片,并将每类图片的一部分存入训练集另一部分存入测试集,训练集和测试集构成地表纹理数据库;
步骤2,采用AlexNet卷积神经网络模型,获取地表纹理数据库所有图像的深度视觉特征并保存;
步骤3,在建立的地表纹理数据库中,对不同种非结构化道路分别定义标签,采用支持向量机算法分析训练集的深度视觉特征得到判决函数,分析测试集的深度视觉特征得到测试集的预测标签和分类准确率;
步骤4,判断准确率是否高于设定值,若高于设定值则保留地表纹理数据库;否则,从新获取不同种非结构化道路的图片。
步骤2中,每一张图像经过5个卷积层和2个全连接层输出深度视觉特征向量。
步骤4所述的支持向量机算法具体为:
步骤4.1.1,建立n维的数据空间中的一个超平面,其表达式为
ωTx+b=0
ω为n维向量,b为常数;
步骤4.1.2,构造分类函数使得超平面有效地将两类数据分开,分类函数为:
f(x)=ωTx+b
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611163755.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度信息的人体检测方法
- 下一篇:一种基于动作识别技术的人体步态分析系统