[发明专利]一种低计算能力处理设备的计算机视觉处理方法及装置有效
申请号: | 201710474712.0 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107145939B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 胡玉炜;李定华;苏磊;靳江明 | 申请(专利权)人: | 北京图森智途科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F17/15 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 101300 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 能力 处理 设备 计算机 视觉 方法 装置 | ||
本发明公开一种低计算能力处理设备的计算机视觉处理方法及装置,以解决现有技术神经网络计算速度慢、实时性差的问题。方法包括:将卷积层的输入数据沿着通道方向进行二值化和位打包操作,得到压缩输入数据;将所述卷积层的各卷积核分别沿着通道方向进行二值化和位打包操作得到相应的压缩卷积核;将所述压缩输入数据按照卷积运算顺序依次划分为与压缩卷积核大小相同的数据块,一次卷积运算包含的输入数据构成一个数据块;将所述压缩输入数据的每个数据块依次与各压缩卷积核进行卷积运算得到卷积结果,并根据卷积结果得到所述卷积层的多个输出数据。本发明技术方案能够提高神经网络计算速度和实时性。
技术领域
本发明涉及计算机视觉领域,特别涉及一种低计算能力处理设备的计算机视觉处理方法及装置。
背景技术
近几年来,深度神经网络在计算机视觉领域的各类应用中取得了巨大的成功,如图像分类、目标检测、图像分割等。
但深度神经网络的模型往往包含大量的模型参数,计算量大、处理速度慢,无法在一些低功耗、低计算能力的设备(如嵌入式设备、集成设备等)上进行实时计算。
发明内容
鉴于上述问题,本发明提供一种低计算能力处理设备的计算机视觉处理方法及装置,以解决现有技术神经网络计算速度慢、实时性差的问题。
本发明实施例,一方面提供一种神经网络优化方法,该方法包括:
将卷积层的输入数据沿着通道方向进行二值化和位打包操作,得到压缩输入数据;
将所述卷积层的各卷积核分别沿着通道方向进行二值化和位打包操作得到相应的压缩卷积核;
将所述压缩输入数据按照卷积运算顺序依次划分为与压缩卷积核大小相同的数据块,一次卷积运算包含的输入数据构成一个数据块;
将所述压缩输入数据的每个数据块依次与各压缩卷积核进行卷积运算得到卷积结果,并根据卷积结果得到所述卷积层的多个输出数据。
本发明实施例,另一方面提供一种神经网络优化装置,该装置包括:
第一数据处理单元,用于将卷积层的输入数据沿着通道方向进行二值化和位打包操作,得到压缩输入数据;
第二数据处理单元,用于将所述卷积层的各卷积核分别沿着通道方向进行二值化和位打包操作得到相应的压缩卷积核;
卷积单元,用于将所述压缩输入数据的每个数据块依次与各压缩卷积核进行卷积运算,得到卷积结果;
输出单元,用于根据所述卷积结果得到所述卷积层的多个输出数据。
本发明技术方案带来以下技术效果:
1、在实际应用中,卷积层的输入数据一般为三维数据、卷积核为四维数据,其通道数非常大,若直接采用卷积核对输入数据进行卷积运算其运算量非常大,速度较低。而本发明提供的方案,将卷积层的输入数据和各卷积核分别沿着通道方向进行二值化和位打包操作得到压缩输入数据和压缩卷积核,不仅在通道方向对输入数据和各卷积核进行数据压缩使得参与卷积运算的数据量大大减少,而且输入数据与卷积核的卷积运算由现有技术的浮点数与浮点数相乘变成了无符号整数与无符号整数之间的按位操作,提高了卷积运算速度;且CPU擅长按位操作,因此本发明技术方案优化后的神经网络更加适用于在CPU上实现实时计算;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京图森智途科技有限公司,未经北京图森智途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710474712.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家用植物栽培机的辅助照明装置
- 下一篇:一种无线开锁智能可视门铃