[发明专利]卷积神经网络模型的通道调整方法、装置和设备在审
申请号: | 202110167609.8 | 申请日: | 2021-02-07 |
公开(公告)号: | CN112766277A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 张洪光 | 申请(专利权)人: | 普联技术有限公司 |
主分类号: | G06K9/42 | 分类号: | G06K9/42;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 518000 广东省深圳市南山区深南路科技*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 模型 通道 调整 方法 装置 设备 | ||
本发明公开了一种卷积神经网络模型的通道转换方法,包括:当输入图片的当前格式与卷积神经网络模型的输入格式不同时,提取卷积神经网络模型中第一层卷积层的权重;对所述输入图片进行尺寸调整,得到所述输入图片的目标格式;根据所述输入图片的目标格式对所述卷积层的权重进行调整,得到所述卷积层的目标权重;将所述目标权重赋值给所述卷积层。本发明还公开了一种卷积神经网络模型的通道调整装置、设备和一种计算机可读存储介质。采用本发明实施例,能支持不同框架模型中通道的调整,提高了模型的处理效率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种卷积神经网络模型的通道调整方法、装置和设备。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。在人工智能技术领域,深度学习是一类机器学习算法,使用多个层逐步从原始输入中逐步提取更高级别的特征。例如,在图像处理中,较低层可以识别边缘,而较高层可以识别对人类有意义的部分,可以在分类和检测任务中达到较高的准确率。但是,由于受限于训练过程中使用的数据集和预处理工具,训练完成的神经网络通常仅能用在与训练集类型相同/数据格式一致的应用环境下,如果需要使用不同类型的输入数据,比如将YUV格式的图片输入到RGB输入模型中,通常是对当前图片的格式做一次转换,将图片从YUV格式转换为RGB格式,然后再输入到RGB输入模型中,但是格式的转换需要消耗计算,如果有很多的YUV格式图片,将它们一一转换消耗的时间长,导致网络预处理时间长,数据处理效率低。
发明内容
本发明实施例的目的是提供一种卷积神经网络模型的通道调整方法、装置、设备和存储介质,能支持不同框架下模型中卷积通道的调整,提高了卷积神经网络模型的处理效率。
为实现上述目的,本发明实施例提供了一种卷积神经网络模型的通道调整方法,包括:
当输入图片的当前格式与卷积神经网络模型的输入格式不同时,提取卷积神经网络模型中第一层卷积层的权重;
对所述输入图片进行尺寸调整,得到所述输入图片的目标格式;
根据所述输入图片的目标格式对所述卷积层的权重进行调整,得到所述卷积层的目标权重;
将所述目标权重赋值给所述卷积层。
作为上述方案的改进,所述对所述输入图片进行尺寸调整,包括:
取所述输入图片的其中一个通道作为目标通道;
根据所述目标通道的尺寸对所述输入图片的其余通道的尺寸进行调整。
作为上述方案的改进,所述根据所述目标通道的尺寸对所述输入图片的其余通道的尺寸进行调整,包括:
根据所述目标通道的尺寸,对所述输入图片的其余通道中的子通道进行复制,以使所述其余通道的尺寸与所述目标通道的尺寸相同。
作为上述方案的改进,所述根据所述输入图片的目标格式对所述卷积层的权重进行调整,包括:
获取所述输入图片的目标格式与所述卷积神经网络模型的输入格式之间的转换关系,根据所述转换关系对所述卷积层的权重进行调整。
作为上述方案的改进,所述根据所述输入图片的目标格式对所述卷积层的权重进行调整,包括:
对所述卷积层的权重进行一次格式转换,以将所述卷积层的权重从初始格式转换成通用格式;其中,所述通用格式为扩展程序库中的数组形式;
根据所述输入图片的目标格式对所述通用格式下的所述卷积层的权重进行调整;
对所述通用格式下的所述卷积层的权重进行二次格式转换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普联技术有限公司,未经普联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110167609.8/2.html,转载请声明来源钻瓜专利网。