[发明专利]基于排序聚类序列辨别选择的草图图像检索方法及系统在审
| 申请号: | 202111259946.6 | 申请日: | 2021-10-28 |
| 公开(公告)号: | CN114020948A | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 陈亚雄;汤一博;李小玉;赵东婕;熊盛武 | 申请(专利权)人: | 武汉理工大学 |
| 主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/58;G06N3/04;G06N3/08 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
| 地址: | 430070 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 排序 序列 辨别 选择 草图 图像 检索 方法 系统 | ||
本发明公开了一种基于排序聚类序列辨别选择的草图图像检索方法,首先绘制查询草图并选择辨别区域,同时利用排序信息来聚合相同类别的样本,通过这样做,可以了解样本在其他模态下应该是什么样子。最后我们利用哈希码来执行草图图像的检索。本发明设计有序列辨别选择模块的三元组transformer主干,捕捉草图和自然图像之间的重要辨别域;提出由三元组项,语义相似项,排序聚类项和辨别学习项构成的目标函数,在哈希码学习过程中保持哈希码的语义相似性,捕捉不同模态之间的相似性,优化排序信息从而对相似实例进行聚类并且知道辨别域学习。解决冗余信息和忽略排序信息的问题,使检索精度更高,进一步提升性能。
技术领域
本发明属于图像检索技术领域,涉及一种草图图像检索方法及系统,特别涉及一种基于排序聚类序列辨别选择的草图图像检索方法及系统。
背景技术
由于触摸屏设备的爆炸性增长,草图的使用变得越来越频繁:用户可以随时随地用手指在触摸屏设备上绘制草图。利用草图挖掘有效的自然图像是非常有意义的。因此草图图像检索受到的关注越来越多,草图图像检索的目的是通过利用手绘草图作为查询方式来匹配自然图像。
现有的草图图像检索方法大致分为两类:手工制作方法和深度学习方法。但因为手工制作特征不能有效地表示具有较大变化和歧义的自然图像和未对齐草图的边缘,手工制作草图图像检索方法不能很好地减少草图和自然图像之间的跨域差异。为了解决跨域差异的问题,提出了深度学习草图图像检索方法。但现有的深度学习方法仍面临两个挑战:(1)草图和自然图像包含具有相似轮廓形状的不同对象。一些深度学习草图检索方法不能捕捉草图和自然图像之间重要的辨别域,导致信息冗余问题,最终影响草图图像检索的性能;(2)排序信息与检索结果密切相关。在草图检索任务的哈希码学习过程中,现有的方法忽略了对排序信息的利用,导致性能不理想。
发明内容
本发明针对现有技术的不足,提供一种基于排序聚类序列辨别选择的草图图像检索方法及系统,充分利用区分区域和排序信息来执行哈希码学习,首先绘制查询草图并选择辨别区域,同时利用排序信息来聚合相同类别的样本,通过这样做,可以了解样本在其他模态下应该是什么样子。最后利用哈希码来执行草图图像的检索。
本发明的方法所采用的技术方案是:一种基于排序聚类序列辨别选择的草图图像检索方法,首先构建草图图像检索网络,然后利用所述草图图像检索网络进行草图图像检索;
所述构建草图图像检索网络,具体实现包括以下步骤:
步骤1:构建草图图像检索网络;
所述草图图像检索网络,包括transformer分割模块、线性投影模块、transformer编码模块;
所述transformer分割模块,用于将输入图像分成M个2D小块图像xp,每幅图像的大小是H×W,图像中每个小块图像的大小是P×P,
所述线性投影模块,用于将所述transformer模块输出的小块图像映射到D维度,将可学习的位置嵌入添加到小块图像嵌入中,用以保存位置信息;其中,嵌入向量记为z0,位置零的输出是D维类令牌xclass;
所述transformer编码模块,用于通过送入transformer编码模块的z0,挖掘序列中小块图像之间的关系;所述transformer编码模块包括L个transformer层和一个哈希层,每个transformer层包含多头自注意层MSA和Conv1×1块,Conv1×1块由带有1×1的卷积核的两个卷积层和一个全连接层;对于每一个transformer层,它的输入都是前一层的输出;第L层transformer输出输入哈希层,进行深度哈希函数学习,将输出的哈希码用于构建目标函数中的三元组项、类别级语义项和排序聚类项;
步骤2:获取现有草图图像数据集,将数据集划分为训练数据集、验证数据集和测试数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111259946.6/2.html,转载请声明来源钻瓜专利网。





