[发明专利]基于CNN特征词汇树的图像检索方法有效
申请号: | 201710568550.7 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107423379B | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 王颖;李洁;陈佳丽;焦志成;范淼;薛学通;王斌;路文;何立火 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 韦全生;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn 特征 词汇 图像 检索 方法 | ||
1.一种基于CNN特征词汇树的图像检索方法,其特征在于,包括如下步骤:
(1)提取图像库中各图像的CNN特征:
(1a)将图像库的每个图像分别绕其中心进行多角度旋转,同时进行中心轴对称变换,并截取每个图像四个顶角部位的子图以及与每个图像同中心的多种边长子图,得到各图像的多个衍生图像,将每个图像库图像对应的衍生图像个数记为m;
(1b)将各图像对应的衍生图像输入到CNN网络中,并提取CNN网络全连接层的输出向量,作为图像库中各图像的CNN特征,其中,每个图像库图像有m个CNN特征;
(2)构建包括节点、节点权重和叶节点倒排文件的CNN特征词汇树:
(2a)设待构建CNN特征词汇树的层数为L,分支数为K,当前层数l为1;
(2b)对所有图像的CNN特征进行聚类,得到K个特征子集和聚类中心并将作为待构建CNN特征词汇树的第l层节点,其中,t表示得到的第t个特征子集,且1≤t≤K;
(2c)对第l层节点的每个特征子集对应的CNN特征分别进行聚类,得到K个特征子集和聚类中心并将作为待构建CNN特征词汇树的第l+1层节点;
(2d)将当前层数l的值更新为l+1,重复执行步骤(2c)~(2d),直到l=L为止,得到待构建CNN特征词汇树的所有节点;
(2e)将每个CNN特征在待构建CNN特征词汇树各层对应的节点,作为该CNN特征的路径Pd,j,其中,d表示该CNN特征对应图像库的第d个图像,j为图像库第d个图像的第j个CNN特征,且1≤j≤m;
(2f)采用TF-IDF方法,给待构建CNN特征词汇树的每个节点赋予权重w(v),得到待构建CNN特征词汇树的所有节点的权重,其中,v为待构建CNN特征词汇树的第v个节点;
(2g)获取待构建CNN特征词汇树的每个叶节点对应的CNN特征,并将该CNN特征对应的图像库图像作为每个叶节点的倒排文件,得到待构建CNN特征词汇树所有叶节点的倒排文件;
(3)提取各待检索图像的CNN特征:
(3a)将每个待检索图像分别绕其中心进行多角度旋转,同时进行中心轴对称变换,并截取每个待检索图像四个顶角部位的子图以及与每个待检索图像同中心的多种边长子图,得到各待检索图像的多个衍生图像,其中,每个待检索图像有m个衍生图像;
(3b)将各待检索图像对应的衍生图像输入到CNN网络中,并提取CNN网络全连接层的输出向量,作为各待检索图像的CNN特征,其中,每个待检索图像有m个CNN特征;
(4)获取各待检索图像和其相关图像的综合相似度:
(4a)设待检索图像的总数为M,当前待检索图像为第q=1个待检索图像;
(4b)获取第q个待检索图像的每个CNN特征的路径Pq,i,其中,i为第q个待检索图像的第i个CNN特征,且1≤i≤m;
(4c)获取第q个待检索图像的所有CNN特征的路径对应的叶节点,并将叶节点的倒排文件对应的图像库图像作为第q个待检索图像的相关图像;
(4d)设Nq为第q个待检索图像的相关图像总数,d为第q个待检索图像的第d个相关图像,并设d的值为1;
(4e)计算第q个待检索图像和其第d个相关图像的初始相似度si(q,d);
(4f)计算第q个待检索图像和其第d个相关图像的所有CNN特征的最小距离,并求最小距离的均值,将所得最小距离的均值作为第q个待检索图像和其第d个相关图像的距离D(q,d);
(4g)将D(q,d)的倒数进行归一化处理,并将得到的结果和初始相似度si(q,d)相乘,得到第q个待检索图像和其第d个相关图像的综合相似度S(q,d);
(4h)将d的值更新为d+1,重复执行步骤(4e)~(4h),直到d=Nq为止,得到第q个待检索图像和其相关图像的综合相似度;
(4i)将q的值更新为q+1,重复执行步骤(4b)~(4i),直到q=M为止,得到各待检索图像和其相关图像的综合相似度;
(5)输出各待检索图像的检索结果:
(5a)将各待检索图像的所有相关图像按照综合相似度得分从高到低顺序进行排序,得到对应的排序后的相关图像;
(5b)设x为用户要求返回的相关图像个数,将各待检索图像的前x张排序后的相关图像作为各待检索图像的检索结果,并输出各待检索图像的检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568550.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种印控仪的取章设备
- 下一篇:一种金融票据压平打孔装置