[发明专利]对象类别识别方法、装置、设备及存储介质在审
申请号: | 201710736890.6 | 申请日: | 2017-08-24 |
公开(公告)号: | CN107516112A | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司11415 | 代理人: | 王茹 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 类别 识别 方法 装置 设备 存储 介质 | ||
技术领域
本申请涉及信息识别技术领域,尤其涉及对象类别识别方法、装置、设备及存储介质。
背景技术
近年来,在深度学习技术的推动下,图像、语音等对象分类识别取得了突飞猛进的进展。深度学习中可以用深度卷积网络(Convolutional Neural Networks,CNN),深度卷积网络是多层的神经网络,该神经网络对输入的对象进行了多层非线性变换,通过对网络各层输出的可视化结果分析表明,神经网络各层的非线性变换结果在语义层面上从底层到高层不断递进,低层输出接近于对象的形态信息,高层输出接近于对象的类别信息。
在深度卷积神经网络中,激活函数(activation function)起到的作用,类似于人类脑神经元的作用,激活的神经元通过激活函数把特征保留并映射出来,这是神经网络能解决非线性问题关键。采用目前的激活函数进行训练,获得的模型泛化能力较弱。然而,泛化能力对对象识别准确率至关重要,泛化能力越强,对象识别准确率越高;泛化能力越弱,对象识别准确率越低。
发明内容
为克服相关技术中存在的问题,本公开提供了对象类别识别方法、装置、设备及存储介质。
根据本公开实施例的第一方面,提供一种对象类别识别方法,所述方法包括:
获取待识别对象;
将所述待识别对象输入预先生成的类别识别模型;
基于所述类别识别模型的输出结果确定所述待识别对象所属类别;
其中,所述类别识别模型基于预设神经网络训练获得,所述预设神经网络中每个神经元的激活函数包含有变量参数,每次进行激活操作时对所述变量参数进行随机赋值。
在一个可选的实现方式中,所述预设神经网络中,同一通道内神经元的激活函数的变量参数被赋予相同随机值,不同通道内神经元的激活函数的变量参数被赋予不同随机值。
在一个可选的实现方式中,所述预设神经网络为预设深度卷积神经网络,所述激活函数包括第一激活函数和第二激活函数,第一激活函数至少包括第一变量参数,第二激活函数至少包括第二变量参数,所述第一激活函数在输入值大于或等于预设值时被执行,所述第二激活函数在输入值小于预设值时被执行。
在一个可选的实现方式中,所述预设值为0,所述激活函数如下:
a表示当输入值大于或等于0时激活函数的斜率值,b表示当输入值小于0时激活函数的斜率值。
在一个可选的实现方式中,所述amin=tan30°,amax=tan60°,bmin=tan30°,bmax=tan60°。
根据本公开实施例的第二方面,提供一种对象类别识别装置,所述装置包括:
对象获取模块,被配置为获取待识别对象;
类别识别模块,被配置为将所述待识别对象输入预先生成的类别识别模型;
类别确定模块,被配置为基于所述类别识别模型的输出结果确定所述待识别对象所属类别;
其中,所述类别识别模型基于预设神经网络训练获得,所述预设神经网络中每个神经元的激活函数包含有变量参数,每次进行激活操作时对所述变量参数进行随机赋值。
在一个可选的实现方式中,所述预设神经网络中,同一通道内神经元的激活函数的变量参数被赋予相同随机值,不同通道内神经元的激活函数的变量参数被赋予不同随机值。
在一个可选的实现方式中,所述预设神经网络为预设深度卷积神经网络,所述激活函数包括第一激活函数和第二激活函数,第一激活函数至少包括第一变量参数,第二激活函数至少包括第二变量参数,所述第一激活函数在输入值大于或等于预设值时被执行,所述第二激活函数在输入值小于预设值时被执行。
在一个可选的实现方式中,所述预设值为0,所述激活函数如下:
a表示当输入值大于或等于0时激活函数的斜率值,b表示当输入值小于0时激活函数的斜率值。
在一个可选的实现方式中,所述amin=tan30°,amax=tan60°,bmin=tan30°,bmax=tan60°。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待识别对象;
将所述待识别对象输入预先生成的类别识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710736890.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摄像头的镜头结构、摄像头结构及移动终端
- 下一篇:一种数码显微镜