[发明专利]图像处理方法、装置、电子设备及存储介质在审
| 申请号: | 201810439263.0 | 申请日: | 2018-05-09 |
| 公开(公告)号: | CN108647307A | 公开(公告)日: | 2018-10-12 |
| 发明(设计)人: | 马福强;闫桂新;董泽华 | 申请(专利权)人: | 京东方科技集团股份有限公司;北京京东方光电科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视觉词典 视觉特征 视觉单词 存储介质 电子设备 距离最近 图像处理 残差 图像处理技术 存储规模 获取图像 聚类中心 提取图像 训练图像 训练集 移动端 聚类 输出 返回 部署 | ||
本发明的实施例提供了一种图像处理方法、装置、电子设备及存储介质,涉及图像处理技术领域。该方法包括:S10.获取图像训练集,并提取图像训练集中各训练图像的视觉特征;S20.对所述视觉特征进行聚类,生成以聚类中心作为视觉单词组成的视觉词典,并将视觉词典的数量加1;S30.判断视觉词典的数量是否等于预定数量,若是,则输出所生成的预定数量个视觉词典,若否,则执行步骤S40;S40.确定视觉词典中与视觉特征距离最近的视觉单词;S50.计算视觉特征与距离最近的视觉单词的残差,将所述残差作为新的所述视觉特征,并返回至步骤S20。本发明实施例的技术方案能够显著降低视觉词典的存储规模,便于在移动端进行部署。
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像处理方法、图像处理装置、电子设备以及计算机可读存储介质。
背景技术
图像检索技术在模式识别、SLAM(simultaneous localization and mapping,即时定位与地图构建)以及人工智能等领域应用很广泛。
图像检索技术的基本概念为:给定一张待检索图像,从特定图像库中检索出与待检索图像相似的图像或图像集合。目前的图像检索技术例如基于词袋模型的图像检索技术中,在图像库规模变大时,为了增加图像向量的可区分性,通常需要非常大的视觉单词规模,在图像检索阶段,则需要预先加载由这些视觉单词组成的视觉词典,这将极大地增加内存的占用,难以满足在移动端部署的需求。
因此,如何能够有效降低视觉词典中视觉单词的规模成为亟待解决的技术问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种图像处理方法、图像处理装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明实施例的第一方面,提供了一种图像处理方法,包括:S10.获取图像训练集,并提取所述图像训练集中各训练图像的视觉特征;S20.对所述视觉特征进行聚类,生成以聚类中心作为视觉单词组成的视觉词典,并将所述视觉词典的数量加1;S30.判断所述视觉词典的数量是否等于预定数量,若是,则输出所生成的所述预定数量个视觉词典,若否,则执行步骤S40;S40.确定所述视觉词典中与所述视觉特征距离最近的视觉单词;S50.计算所述视觉特征与所述距离最近的视觉单词的残差,将所述残差作为新的所述视觉特征,并返回至步骤S20。
在本发明的一些实施例中,基于前述方案,所述图像处理方法还包括:提取待检索图像的视觉特征;从所述预定数量个视觉词典中确定与所述待检索图像的视觉特征距离最近的多个视觉单词,所述多个视觉单词的数量与所述视觉词典的数量相同;基于所述多个视觉单词的索引确定所述待检索图像的视觉特征的索引。
在本发明的一些实施例中,基于前述方案,所述图像处理方法还包括:基于所述预定数量个视觉词典确定所述训练图像的各视觉特征的索引;确定所述训练特征的各视觉特征的索引的词频-逆文档频率权重;基于各所述视觉特征的索引的所述词频-逆文档频率权重生成所述训练图像的词袋向量。
在本发明的一些实施例中,基于前述方案,基于所述预定数量个视觉词典确定所述训练图像的各视觉特征的索引,包括:从所述预定数量个视觉词典中确定与所述视觉特征距离最近的多个视觉单词,所述多个视觉单词的数量与所述视觉词典的数量相同;基于所述多个视觉单词的索引确定所述视觉特征的索引。
在本发明的一些实施例中,基于前述方案,所述图像处理方法还包括:提取待检索图像的视觉特征;基于所述预定数量个视觉词典确定所述待检索图像的视觉特征的词袋向量;确定所述待检索图像的所述词袋向量与所述训练图像的词袋向量的相似性;以及基于所确定的相似性的大小输出与所述待检索图像相似的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司;北京京东方光电科技有限公司,未经京东方科技集团股份有限公司;北京京东方光电科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810439263.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二维码扫码交互方法和装置
- 下一篇:分布式系统的序列号生成方法及装置





