[发明专利]图像内容物品定位方法及其装置、设备、介质、产品在审
| 申请号: | 202111315772.0 | 申请日: | 2021-11-08 |
| 公开(公告)号: | CN114140626A | 公开(公告)日: | 2022-03-04 |
| 发明(设计)人: | 李保俊 | 申请(专利权)人: | 广州华多网络科技有限公司 |
| 主分类号: | G06V10/72 | 分类号: | G06V10/72;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
| 地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 内容 物品 定位 方法 及其 装置 设备 介质 产品 | ||
1.一种图像内容物品定位方法,其特征在于,包括如下步骤:
获取表征目标图像的深层语义信息的特征图,所述特征图由多个平面点构成,每个平面点均为高维向量;
计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,使该相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似;
以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集;
统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像。
2.根据权利要求1所述的图像内容物品定位方法,其特征在于,获取表征目标图像的深层语义信息的特征图,包括如下步骤:
获取目标图像;
采用预训练的图像特征交互模型将目标图像切割为多个细分图像并分别提取图像特征向量;
采用所述图像特征交互模型将所述细分图像的图像特征向量进行特征交互,获得中间向量;
采用所述图像特征交互模型将所述中间向量归一化为特征图,使该特征图由多个平面点构成,每个平面点均为高维向量。
3.根据权利要求1所述的图像内容物品定位方法,其特征在于,计算两两平面点之间的相似度,以该相似度构造相似状态矩阵,包括如下步骤:
计算所述特征图中两两平面点之间的相似度,构造出相应的相似数值矩阵,所述相似数值矩阵中,每个元素存储其行坐标相对应的平面点与其列坐标相对应的平面点之间相似度数值;
根据所述相似数值矩阵,构造出相应的相似状态矩阵,所述相似状态矩阵中的每个元素表征其行坐标相对应的平面点与其列坐标相对应的平面点之间相似或不相似。
4.根据权利要求3所述的图像内容物品定位方法,其特征在于,所述相似数值矩阵中的相似度数值被归一化为[-1,1]区间,所述相似状态矩阵中以数值1表示相似,以数值0表示不相似。
5.根据权利要求1所述的图像内容物品定位方法,其特征在于,以相似平面点的多寡由少至多预选多个平面点构成初步集合,在初步集合中查找与具有最少相似平面点的种子平面点构成相似的平面点构成种子集,包括如下步骤:
根据所述相似状态矩阵,统计所述特征图中每个平面点的点相似总量,所述点相似总量表示与该平面点构成相似的平面点的总数量,获得由各个平面点的相似总构成的相似总量序列;
对所述相似总量序列进行逆向排序,以点相似总量由少至多预选出额定数量的多个平面点,构造为初步集合;
将该初步集合中点相似总量最小的平面点确定为种子点,从初步集合中选取与该种子点构成相似的所有平面点,构造为种子集。
6.根据权利要求3所述的图像内容物品定位方法,其特征在于,统计特征图中每个平面点与种子集中所有平面点的相似度的和值,当该和值大于预设阈值时,判定相应的平面点属于物品区域,获得该物品区域相应的图像,包括如下步骤:
根据所述相似数值矩阵,统计特征图中每个平面点与种子集中所有平面点的相似度的和值;
判断该和值是否大于预设阈值,当该和值大于该预设阈值时,即确定相应的平面点属于物品区域;
根据所述物品区域从所述目标图像中提取相应的图像,作为内容物品图像。
7.根据权利要求6所述的图像内容物品定位方法,其特征在于,根据所述物品区域从所述目标图像中提取相应的图像,包括如下步骤:
针对每个物品区域,判断该物品区域是否与目标图像重叠,若不重叠则判定该物品区域有效,将该物品区域的平面点在特征图中的特征值清零后重启确定物品区域的全过程进行迭代确定物品区域;
若当前物品区域与目标图像重叠,判定该物品区域无效,停止迭代确定物品区域;
根据被判定为有效的物品区域从所述目标图像中提取出相应的一个或多个内容物品图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111315772.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





