[发明专利]一种基于嵌入式终端的深度学习行人检测方法在审
申请号: | 201810565780.2 | 申请日: | 2018-06-05 |
公开(公告)号: | CN108805070A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 张中;牛雷;王定国 | 申请(专利权)人: | 合肥湛达智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 嵌入式终端 卷积神经网络 特征学习 行人检测 移植 算法复杂度 移动摄像头 测试阶段 测试图像 传统机器 创新优势 代码级别 功能应用 检测结果 人工标注 网络规模 训练阶段 训练图像 样本准备 优化策略 自动驾驶 数据集 构建 学习 视频 拍摄 检测 优化 | ||
1.一种基于嵌入式终端的深度学习行人检测方法,用于对交通视频中的行人进行实时检测,其特征在于,包括以下步骤:
一、样本准备阶段,获取现有自动驾驶数据集或收集固定、移动摄像头拍摄视频后人工标注;
二、训练阶段,使用大量训练图像对构建的卷积神经网络参数进行训练以完成检测特征学习;
三、测试阶段,输入大量测试图像至已训练卷积神经网络并获得检测结果;
四、移植阶段,进行代码级别优化并移植到嵌入式终端。
2.根据权利要求1所述的基于嵌入式终端的深度学习行人检测方法,其特征在于,步骤一中现有自动驾驶数据集包括Nicta和CVC数据集,人工标注的图片标记格式包含标签和2d矩形框。
3.根据权利要求1所述的基于嵌入式终端的深度学习行人检测方法,其特征在于,步骤二训练阶段按以下步骤进行:
①、选取18层卷积神经网络作为特征学习网络,依次是卷积层conv1、最大池化层maxpool2、卷积层conv3、最大池化层maxpool4、卷积层conv5、卷积层conv6、卷积层conv7、最大池化层maxpool8、卷积层conv9、卷积层conv10、卷积层conv11、最大池化层maxpoo12、卷积层conv13、卷积层conv14、卷积层conv15、最大池化层maxpool16、全连接层fc17、全连接层fc18;
②、将输入图像划分为S*S的栅格,为每一个栅格赋予B个边界框以及这些边界框的置信值,定义C个条件类别概率:Pr(Classi|Object);使用K-means从训练集中聚类得到优化的anchor boxes;
③、使用以下公式预测行人的坐标:
x=(tx*wa)+xa,y=(ty*ha)+ya
其中xa,ya为anchor的坐标,wa,ha为anchor的宽和长;x,y是边界框的中心坐标;当预测tx=1,就会把边界框向右边移动一定距离,预测tx=-1,就会把边界框向左边移动相同的距离;
并使用logistic激活函数σ(z)来确保边界框的中心落在栅格中:
设栅格左上角的坐标为(cx,cy),anchor box的宽和高为(pw,ph),则边界框的中心点坐标(bx,by),宽和高为(bw,bh):
bx=σ(tx)+cx,by=σ(ty)+cy
并利用以下公式计算该目标的置信分:
Pr(object)*IOU(b,object)=σ(to)
④、构造损失函数:
其中λcoord是系数,S2是网格数,wi,hi分别为网格i的预测边界的宽和高,分别为网格i的标签边界的宽和高,xi,yi为网格i的预测边界框中心相对于网格i的位置,为网格i的标签边界框中心相对于网格i的位置,pi(c)为网格i的预测边界框关于类别c的置信度,为网格i的标签边界框关于类别c的置信度,classes为第二训练样本集中的样本类别数,Ci为网格i的预测边界框的预测分类,为网格i的标签边界框的标签分类;
⑤、通过不断的进行梯度下降和反向传播算法进行迭代,应用损失函数提高准确率,当损失函数真值J(θ)<0.001,卷积神经网络完成训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥湛达智能科技有限公司,未经合肥湛达智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810565780.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:影像检测方法及装置
- 下一篇:身份核验方法及装置、电子设备、存储介质