[发明专利]一种视频数据处理方法、系统及相关组件有效
申请号: | 202011026282.4 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112016522B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 董刚;赵雅倩;李仁刚;杨宏斌;刘海威;蒋东东 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/77;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘志红 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 数据处理 方法 系统 相关 组件 | ||
本申请公开了一种视频数据处理方法,包括:获取视频数据对应的三维特征数据和三维权重数据;对三维特征数据和三维权重数据分别进行预处理,得到特征值矩阵及权重值矩阵;将特征值矩阵和权重值矩阵输入多个三维脉动阵列并行计算,得到视频数据处理结果。本申请能够充分扩展计算的并行度,采用多重三维脉动阵列构造四维脉动计算架构对三维特征值矩阵和三维权重值矩阵进行并行计算,缩短了三维卷积的计算时间,提高了视频数据处理效率。本申请还公开了一种三维卷积并行计算系统、电子设备及计算机可读存储介质,具有以上有益效果。
技术领域
本申请涉及视频数据处理领域,特别涉及一种视频数据处理方法、系统及相关组件。
背景技术
视频特征提取是视频数据处理的一个基本环节,几乎所有视频分析和处理的过程,都需要先对视频特征进行提取。三维CNN(Convolutional Neural Networks,卷积神经网络)以其能更好的捕获视频中的时间和空间的特征信息,在视频分类、动作识别等领域发挥着巨大的优势,三维卷积是三维CNN中的主要计算步骤,通过三维卷积可以对视频数据进行分类或从中提取特征,目前对于三维卷积计算的方法基本都是采用降低维度,将三维数据转化映射为二维数据甚至是一维数据,进行局部的并行计算,由于计算量巨大,运行速度非常缓慢,导致视频数据处理效率低。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本申请的目的是提供一种视频数据处理方法、系统、电子设备及计算机可读存储介质,能够充分扩展计算的并行度,采用多重三维脉动阵列构造四维脉动计算架构对三维特征值矩阵和三维权重值矩阵进行并行计算,缩短了三维卷积的计算时间,提高了视频数据处理效率。
为解决上述技术问题,本申请提供了一种视频数据处理方法,包括:
获取视频数据对应的三维特征数据和三维权重数据;
对所述三维特征数据和所述三维权重数据分别进行预处理,得到特征值矩阵及权重值矩阵;
将所述特征值矩阵和所述权重值矩阵输入多个三维脉动阵列并行计算,得到视频数据处理结果。
优选的,对所述三维特征数据进行预处理得到特征值矩阵的过程具体包括:
对所述三维特征数据按卷积核尺寸进行切割,得到多个特征数据组,按预设映射关系将各个所述特征数据组转换成各自对应的二维矩阵;
根据所有所述二维矩阵得到特征值矩阵。
优选的,对所述三维权重数据进行预处理得到权重值矩阵的过程具体包括:
将所述三维权重数据按所述预设映射关系进行重排,得到权重值矩阵。
优选的,所述将所述特征值矩阵和所述权重值矩阵输入多个三维脉动阵列并行计算,得到视频数据处理结果的过程具体包括:
通过第i个三维脉动阵列根据对应的目标中间值对第i个输入通道中的所述特征值矩阵及所述权重值矩阵执行计算操作,得到第i个计算结果,i=1, 2,…,Cin;
根据第Cin个计算结果得到视频数据处理结果;
其中,当i=1时,所述目标中间值为0,当1<i≤Cin时,所述目标中间值为第i-1个计算结果。
优选的,所述通过第i个三维脉动阵列根据对应的目标中间值对第i个输入通道中的所述特征值矩阵及所述权重值矩阵执行计算操作,得到第i个计算结果的过程具体包括:
将第i个输入通道中的所述特征值矩阵对应的Cout个权重值矩阵分别存储至第i个三维脉动阵列的Cout个计算单元中,Cout为输出通道个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011026282.4/2.html,转载请声明来源钻瓜专利网。