[发明专利]一种使用二进制瓶颈神经网络来抽取图片特征的方法有效
申请号: | 201710568350.1 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107463932B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 张勇;朱立松 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 黄杭飞 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种使用二进制瓶颈神经网络来抽取图片特征的方法,属于视频处理技术领域,通过建立二进制瓶颈神经网络,将图片自动抽取为包含若干个二进制比特的特征向量,当要比较两幅图像之间的相似性程度时,只需要比较两个图片的二进制特征向量,然后计算两个二进制特征向量之间的汉明距离即可:汉明距离越小,说明两幅图像越相似,解决了抽取图片的二进制特征向量的技术问题,本发明计算图像的特征二进制序列,不依赖于研究者的经验进行手工设计就能获得非常好的性能;本发明计算的图像特征二进制序列可用于快速计算图像的相似性,对于图片和视频的相似性检索有重要价值。 | ||
搜索关键词: | 一种 使用 二进制 瓶颈 神经网络 抽取 图片 特征 方法 | ||
【主权项】:
一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:包括如下步骤:步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:y=11+exp(-Wx-b);]]>式中,向量x表示输入层的状态值,W表示从输入层到隐藏层的权值矩阵,b表示隐藏层的偏置值,y表示隐藏层的状态值;隐藏层可以有许多,每一个隐藏层均将近邻的前一个隐藏层作为自身的输入层,并通过公式1来获取输入层的状态值;步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:P(Oi=1)=[11+exp(-Wj-k)]i;]]>式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率;神经网络在计算的过程中首先计算输出层的神经元激活概率值P,然后根据概率值P进行随机采样,从而最后得到输出神经元的激活状态;该神经网络将任意一个图片映射为一个固定长度的二进制序列码,即,图片的二进制特征向量;步骤6:当需要比较图片N和图片M之间的相似度时,首先根据步骤1到步骤5的方法分别计算出图片N和图片M相应的二进制序列码,设定计算出的图片N的二进制序列码为BN,计算出的图片M的二进制序列码为BM;然后计算BN和BM之间的汉明距离H(BN,BM),汉明距离越小,图片N和图片M的相似程度越高;步骤7:在输出层的后方设有一个镜像层,镜像层是以输出层为镜面对隐藏层和输入层的镜像;镜像层的最后一层的神经元个数与输入层的神经元个数相同,镜像层的倒数第二层的神经元个数与第一隐藏层的神经元个数相同。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710568350.1/,转载请声明来源钻瓜专利网。