[发明专利]一种大型图像集的语义信息提取和可视化方法有效

专利信息
申请号: 201711409040.1 申请日: 2017-12-22
公开(公告)号: CN108090199B 公开(公告)日: 2020-02-21
发明(设计)人: 巫英才;谢潇;蔡西文 申请(专利权)人: 浙江大学
主分类号: G06F16/58 分类号: G06F16/58;G06F40/30
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 徐敏
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 大型 图像 语义 信息 提取 可视化 方法
【权利要求书】:

1.一种大型图像集的语义信息提取和可视化方法,其特征在于,包括以下步骤:

(1)获取数据,数据中的属性包括图像的标识ID,图像的像素值,图像集合使用I表示;

(2)步骤(1)中的每张图像进行处理,获得描述图像内容的句子形式的语言描述;

(3)通过词干提取处理步骤(2)获得的语言描述,得到所有描述图像集合的关键词集合W;

(4)提取出步骤(2)处理过程中的中间数据,所述中间数据包括图像的向量形式表征VI和单词的向量形式表征VW

(5)对图像集合I和关键词集合W分别进行投影,得到图像集合I在二维图像空间上的坐标PI和关键词集合W在二维语义空间上的坐标PW

(6)获得图像集合I中的局部语义结构,获取步骤包括:

6-1图像集合I和关键词集合W之间进行双向绑定,具体步骤为:

6-1-1定义Simi(Wi,Ij)来描述任一图像与任一关键词之间的相似性度量:

其中Cj表示Ij的语义描述语句,Wk为Cj内的词;

6-1-2对于任一关键词Wi,定义相关的图像集合为:

其中MiniSimi是最小相似度的阈值;

6-1-3对于任一图像Ij,定义相关的关键词集合为:

其中为总的关键词集合;

6-1-4使用和来代表相互关联的图像和关键词,建立了图像与关键词的多对多关系;

6-2根据步骤6-1的双向绑定结果在二维图像空间中嵌入关键词集合W,具体步骤为:根据步骤6-1-4得多对多关系,将每个关键词嵌入到尽可能靠近相关图像的地方,将关键词Wi嵌入二维图像空间的过程被描述为使得关键词Wi到相关图像加权距离和最小的过程,用公式表达如下:

其中P表示二维图像空间中的任意位置;

6-3提取步骤6-2得到的图像的局部语义结构;

(7)在二维语义空间中对图像进行重构,获得最终的共同投影结果,获取步骤包括:

7-1根据步骤(6)获得的局部语义结构,通过关键词对图像进行重构;

7-2根据关键词之间的关系对关键词进行重构;

(8)将步骤(7)得到的数据进行可视化。

2.如权利要求1所述的大型图像集的语义信息提取和可视化方法,其特征在于,步骤(2)中每张图像通过NIC处理获得描述图像内容的句子形式的语言描述。

3.如权利要求1所述的大型图像集的语义信息提取和可视化方法,其特征在于,步骤(5)中,使用t-SNE算法对图像集合I和关键词集合W分别进行投影。

4.如权利要求1所述的大型图像集的语义信息提取和可视化方法,其特征在于,步骤6-3中提取图像的局部语义结构的具体步骤为:构造对值(Si,Di),其中Si=Simi(Wi,Ij),Di=||Wi-Ij||。

5.如权利要求1所述的大型图像集的语义信息提取和可视化方法,其特征在于,步骤(8)中,采用星系隐喻的散点图进行可视化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711409040.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top