[发明专利]图像内容物品定位方法及其装置、设备、介质、产品在审
| 申请号: | 202111315772.0 | 申请日: | 2021-11-08 |
| 公开(公告)号: | CN114140626A | 公开(公告)日: | 2022-03-04 |
| 发明(设计)人: | 李保俊 | 申请(专利权)人: | 广州华多网络科技有限公司 |
| 主分类号: | G06V10/72 | 分类号: | G06V10/72;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
| 地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 内容 物品 定位 方法 及其 装置 设备 介质 产品 | ||
本申请公开一种图像内容物品定位方法及其装置、设备、介质、产品,所述方法包括:获取目标图像的特征图,特征图由多个平面点构成,每个平面点均为高维向量;计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;以相似平面点的多寡由少至多预选多个平面点构成初步集合,在其中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当和值大于预设阈值时判定相应的平面点属于物品区域。本申请可以实现对目标图像中内容物品的有效定位,具有广泛通用性。
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像内容物品定位方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
图像定位技术,是图像识别技术中的一项基础工作。现实中,大量的应用场景需要用到图像定位技术,包括人脸识别、物品识别等,通过从图片中识别出内容对象,可以裁剪出内容对象相应的图像,进一步可对内容对象的图像进行其他诸如图像检索、匹配、标注等工作。在人工智能技术迅速发展的背景下,还可用于为各种神经网络模型提供精准表达的内容对象图片,以供训练相应的神经网络模型。
示例性的电商应用领域中,商品的识别、商品的检索等相关图像识别技术都是非常重要的环节,对于商品的后续相关分析至关重要,而商品的定位是商品识别检索的首要环节。
目前的物品定位技术都需要大量的人工标注来训练定位模型,一方面,考虑到电商的商品品类数目非常庞大,对每一个品类的商品都进行商品人工定位标注是不现实的,相应的代价非常大。另一方面,与人脸图像存在明显的共有特征不同,电商领域中各式各样的商品图像形态各异,加上商品图像常受清晰度、拍摄视角、物体大小、背景噪声等影响而质量不均。
因此可见,多种原因导致现有广泛应用的各种定位模型的迁移能力及通用性较差,无法对未知商品进行有效定位。因而,有必要探索一种新型的图像定位技术来满足相关领域的需要。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种图像内容物品定位方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种图像内容物品定位方法,包括如下步骤:
获取表征目标图像的深层语义信息的特征图,所述特征图由多个平面点构成,每个平面点均为高维向量;
计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;
以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;
统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像。
深化的实施例中,获取表征目标图像的深层语义信息的特征图,包括如下步骤:
获取目标图像;
采用预训练的图像特征交互模型将目标图像切割为多个细分图像并分别提取图像特征向量;
采用所述图像特征交互模型将所述细分图像的图像特征向量进行特征交互,获得中间向量;
采用所述图像特征交互模型将所述中间向量归一化为特征图,使该特征图由多个平面点构成,每个平面点均为高维向量。
深化的实施例中,计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111315772.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





