[发明专利]一种使用二进制瓶颈神经网络来抽取图片特征的方法有效
申请号: | 201710568350.1 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107463932B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 张勇;朱立松 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 黄杭飞 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 二进制 瓶颈 神经网络 抽取 图片 特征 方法 | ||
1.一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:包括如下步骤:
步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;
步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;
对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;
步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;
步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:
式中,向量x表示输入层的状态值,W表示从输入层到隐藏层的权值矩阵,b表示隐藏层的偏置值,y表示隐藏层的状态值;
每一个隐藏层均将近邻的前一个隐藏层作为自身的输入层,并通过公式1来获取输入层的状态值;
步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:
式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率;
神经网络在计算的过程中首先计算输出层的神经元激活概率值P,然后根据概率值P进行随机采样,从而最后得到输出神经元的激活状态;该神经网络将任意一个图片映射为一个固定长度的二进制序列码,即,图片的二进制特征向量;
步骤6:当需要比较图片N和图片M之间的相似度时,首先根据步骤1到步骤5的方法分别计算出图片N和图片M相应的二进制序列码,设定计算出的图片N的二进制序列码为BN,计算出的图片M的二进制序列码为BM;
然后计算BN和BM之间的汉明距离H(BN,BM),汉明距离越小,图片N和图片M的相似程度越高;
步骤7:在输出层的后方设有一个镜像层,镜像层是以输出层为镜面对隐藏层和输入层的镜像;镜像层的最后一层的神经元个数与输入层的神经元个数相同,镜像层的倒数第二层的神经元个数与第一隐藏层的神经元个数相同。
2.如权利要求1所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:所述汉明距离是指两个二进制序列中不同位的个数,即将两个二进制序列进行异或后的结果中1的个数。
3.如权利要求1所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:在执行步骤7时,虽然镜像层的神经元个数与输入层和隐藏层相同,但是其连接权值不相同;图片从输入层输入,经过二进制瓶颈层之后,从镜像层恢复,中间在二进制瓶颈神经网络中引入了一定的误差,这就需要对二进制瓶颈神经网络进行权值训练,而权值训练的目的是使得上述误差最小化;所述二进制瓶颈神经网络中,二进制神经元的个数决定了该网络能够传递的最大信息量,是整个网络信息量传输的瓶颈,网络训练成功之后,若任意从输入层输入的图片都能在镜像层输出与其非常相似的图片,这说明中间的二进制神经元已经抓取到了该图片的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568350.1/1.html,转载请声明来源钻瓜专利网。