[发明专利]一种用于矿井智能监控的视频图像编解码方法有效
申请号: | 201910014069.2 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109672885B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 张帆;徐志超 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | H04N19/132 | 分类号: | H04N19/132;H04N19/42;H04N19/44;H04N7/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于矿井智能监控的视频图像编解码方法,该方法采用基于机器视觉的卷积神经网络算法,实现对矿井视频图像的编码和解码功能,包含以下步骤:(1)利用矿井视频图像采集设备采集图像,据此制作训练集和测试集;(2)构建矿井视频图像的编码器网络和解码器网络:编码器网络包括降采样层,解码器网络包括升采样层、二分支卷积层、标准化层、非线性激活层和深度变换层;(3)训练网络;(4)用训练好的网络完成矿井视频图像的编码和解码。该方法解决了矿井视频监控系统的编解码和信号重建时间过长的问题,提高了矿井智能视频监控系统的性能。 | ||
搜索关键词: | 一种 用于 矿井 智能 监控 视频 图像 解码 方法 | ||
【主权项】:
1.一种用于矿井智能监控的视频图像编解码方法,其特征在于,采用基于机器视觉的卷积神经网络算法,实现对矿井视频图像的编码和解码功能,包括如下步骤:步骤1,制作训练集和测试集:利用矿井视频图像采集设备采集图像,据此制作训练集和测试集;步骤2,构建矿井视频图像的编码器网络和解码器网络:编码器网络包括降采样层,解码器网络包括升采样层、二分支卷积层、标准化层、非线性激活层和深度变换层;步骤3,网络训练:将训练集输入所述编码器网络,将所述编码器网络的输出作为所述解码器网络的输入,完成网络参数的训练;步骤4,矿井视频图像的编码和解码:利用步骤3中训练好的网络,将步骤1中所述测试集中矿井视频图像输入步骤3中所述编码器网络,矿井视频图像经编码后传输至步骤3中所述解码器网络进行解码,输出矿井视频图像的重构结果;其特征还在于,步骤2中所述的编码器网络通过以下公式对信号进行降采样:y=Φx其中,
为待编码的图像,
为测量矩阵,是所述编码器网络的待学习参数,M<N,
为编码结果;进一步地,步骤2中所述的解码器网络采用多个升采样层‑二分支卷积层级联结构,并与深度变换层连接而成,其中,所述二分支卷积层由两个分支分别连接到加法器,所述两个分支的第一分支由两个或两个以上的分支单元级联后连接至所述加法器,所述两个分支的第二分支直接连接至所述加法器,或通过单个分支单元后连接至所述加法器,所述分支单元由3×3卷积层、标准化层和非线性激活层顺次连接构成;步骤2中所述的升采样层采用双线性插值法对图像进行升采样,得到第k个升采样层输出的图像的像素个数为Pk:
其中,n表示整个解码器网络中升采样层的数量,k=1,2,…,n,M表示解码器网络输入图像的像素个数,N表示来自数据集的原始输入图像的像素个数,符号
表示向上取整;步骤2中所述的标准化层采用批标准化对输入的图像进行标准化;步骤2中所述的非线性激活层采用LeakyReLU函数对输入的信号进行激活,得到:
其中,x表示图像批标准化后的特征图,a为满足0<a<1的常数;步骤2中所述的深度变换层是一种卷积层,该卷积层的卷积核大小为1×1,卷积时采用的步长为1,边缘不补零,其深度与原始图像的深度一致;以及,其特征还在于,步骤3中所述的训练过程包含以下子步骤:步骤3‑1,设定训练的最大迭代次数和训练停止所需的损失阈值,设定输入所述编码器网络和解码器网络的每批次样本的数量;步骤3‑2,采用Adam方法作为梯度下降方法,反向传播对网络参数进行训练;步骤3‑3,重复执行步骤3‑2,直到达到步骤3‑1所设定的最大迭代次数或达到步骤3‑1所设定的损失阈值为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910014069.2/,转载请声明来源钻瓜专利网。
- 上一篇:图像硬件编码处理方法和装置
- 下一篇:一种图像帧预测方法、装置及头显设备