[发明专利]一种使用二进制瓶颈神经网络来抽取图片特征的方法有效
申请号: | 201710568350.1 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107463932B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 张勇;朱立松 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 黄杭飞 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 二进制 瓶颈 神经网络 抽取 图片 特征 方法 | ||
本发明公开了一种使用二进制瓶颈神经网络来抽取图片特征的方法,属于视频处理技术领域,通过建立二进制瓶颈神经网络,将图片自动抽取为包含若干个二进制比特的特征向量,当要比较两幅图像之间的相似性程度时,只需要比较两个图片的二进制特征向量,然后计算两个二进制特征向量之间的汉明距离即可:汉明距离越小,说明两幅图像越相似,解决了抽取图片的二进制特征向量的技术问题,本发明计算图像的特征二进制序列,不依赖于研究者的经验进行手工设计就能获得非常好的性能;本发明计算的图像特征二进制序列可用于快速计算图像的相似性,对于图片和视频的相似性检索有重要价值。
技术领域
本发明属于视频处理技术领域,特别涉及一种使用二进制瓶颈神经网络来抽取图片特征的方法。
背景技术
图像数据属于典型的非结构化数据,图像数据库的查询、检索、相似比较等都存在困难,这是由几个方面的原因造成的:1)图像数据的维度较高,一般高清图像的分辨率可达到约200万像素,而超清图像的分辨率可达到800万像素之多;2)图像所包含的语义很难从数据中直接获取,例如一副图像包含了一辆汽车,人类很容易观察到这一图像语义,而计算机却很难获取这一语义,只有通过人工智能等复杂的算法才能识别图像中包含汽车这一特定语义。
为了使图像更容易被查询、检索、比较,抽取图像特征是现阶段常用的方法。通常使用SIFT算法或SURF算法来抽取图像的局部特征点。
SIFT特征和SURF特征比较相似,都是对特征点局部区域内像素点数值分布的描述,例如SIFT特征的每一个特征点对应一个128位的描述向量,SURF特征的计算速度比SIFT快,每一个特征点对应一个64位的描述向量。
SIFT特征和SURF特征都是手工设计的特征抽取方法。经过特征抽取之后起到了一定的降低数据维度的作用。比较两个图像的相似程度可以通过比较他们之间的SIFT特征或SURF特征来实现。然而其计算得到的特征向量维度仍然较高,在图像的快速检索方面不能满足要求。
发明内容
本发明的目的是提供一种使用二进制瓶颈神经网络来抽取图片特征的方法,解决了抽取图片的二进制特征向量的技术问题。
为实现上述目的,本发明采用以下技术方案:
一种使用二进制瓶颈神经网络来抽取图片特征的方法,包括如下步骤:
步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;
步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;
对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;
步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;
步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:
式中,向量x表示输入层的状态值,W表示从输入层到隐藏层的权值矩阵,b表示隐藏层的偏置值,y表示隐藏层的状态值;
隐藏层可以有许多,每一个隐藏层均将近邻的前一个隐藏层作为自身的输入层,并通过公式1来获取输入层的状态值;
步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568350.1/2.html,转载请声明来源钻瓜专利网。