[发明专利]基于深度卷积特征和语义近邻的多标签图像补全方法有效

专利信息
申请号: 201911286325.X 申请日: 2019-12-13
公开(公告)号: CN111080551B 公开(公告)日: 2023-05-05
发明(设计)人: 张素兰;邓建国 申请(专利权)人: 太原科技大学
主分类号: G06T5/00 分类号: G06T5/00
代理公司: 太原市科瑞达专利代理有限公司 14101 代理人: 王思俊
地址: 030024 山*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 卷积 特征 语义 近邻 标签 图像 方法
【权利要求书】:

1.一种基于深度卷积特征和语义近邻的多标签图像补全方法,其特征是包括下述内容:

(1)在AlexNex通用模型基础上,改进AlexNex模型参数并设计多标签损失函数;

(2)基于K最近邻构建语义近邻模型;

(3)融合上述两个模型构建的模型构建融合深度卷积特征和语义近邻的CNN-KNN模型,将等补全社会化图像输入到CNN-KNN,模型输出候选标签集经带权无向图邻接矩阵滤噪算法过滤噪声标签,输出粗选标签集;

(4)利用CNN-KNN的多标签重要性排序算法对第3步输出的粗选标签集再次过滤噪声标签,并确定最终补全结果;

改进AlexNex模型参数并设计多标签损失函数步骤是:

步骤1:所有卷积层中卷积核的间隔与池化间隔都设置为2,同时加入一个动量项为0.9的异步随机梯度,并将网络初始的学习速率设为0.001;

步骤2:设计多标签损失函数,假设每个标签之间都是相互独立的,那么这些标签可以组成一个标签向量y∈R1×c,其中c为图像集中标签的总数,R∈{0,1},yj=1表示图像包含第j个标签,yj=0表示图像不包含第j个标签,通过正则化y得到图像xi与标签j的概率设计损失函数其中n为图像数量;

构建基于KNN的语义近邻模型方法是:

针对社会化图像中存在视觉相似但语义不相同的问题,从语义上对图像特征加以区分,以提高图像的补全效果;首先,划分语义组构建语义近邻;然后,通过视觉相似度构建视觉近邻;最后,根据距离值确定各标签的贡献值,通过对贡献值排序完成标签预测;

符号定义为,图像集I={I1,I2,…,In},Ii∈Rd表示图像,其中n为图像数量,d为标签数量,R为d维向量,R∈{0,1}d;标签集W={w1,w2,…,wm},其中m为标签数量,wi为标签;训练集Ω={(I1,W1),(I2,W2),…,(In,Wn)},其中Wi为m维向量,Wi∈{0,1}M,当Wij=1时,表示图像i包含标签wj,当Wij=0时,表示图像i不含标签wj,步骤包括:

步骤1:划分语义组构建语义近邻,将每个标签包含的所有图像看成一个语义组,所有标签对应的语义组集表示为G={(w1,I1),(w2,I2),…,(wn,In)},其中wi表示标签,Ii表示与标签wi关联的所有图像,

步骤2:将图像补全预测问题转化为求后验概率问题,定义条件概率p(I|wi)表示标签wi和图像I的概率关系,由概率转换公式可知,图像标签的预测值为其中p(wi)和p(I)为先验概率;

步骤3:构建待补全图像的邻域图像集,令Gi=(wi,Ii)表示标签wi对应的语义组,对于待标注图像I,从Gi中选出与图像I视觉相似度最高的k幅图像得到局部子集其中k为正整数,当所有语义组的局部子集都获取后,合并子集,最终得到待标注图像I的邻域图像集

步骤4:对贡献值排序完成标签预测,对于给定标签它与图像I构成的概率关系表示为其中表示图像Ii对于图像I的贡献值,p(wi|Ii)∈{0,1}用于控制在图像Ii中标签需要增加的贡献值;

带权无向图的邻接矩阵滤噪方法为:

步骤1:定义候选标签间关系,标签与标签之间的关系表示为Rn×n:label×label,其中label为候选标签列表,Rn×n(ci)={w1,w2,w3},其中ci∈label,n为候选标签数量,wi为标签来源权重的平均值,其中cnn输出权重为4,knn输出权重为3,原标注权重为3;

步骤2:确定多标签候选比,在邻接矩阵Rn×n中,对于第i个标签,在多标签中的候选比为其中Hi表示第i标签在所有标签中的候选比,wij表示邻接矩阵中第i个标签的权重;

步骤3:根据固定阈值过滤掉候选比小的标签,选取的标签作为候选标签,其中为固定阈值,取值为0.4;

优化多标签重要性排序算法为:

步骤1:使用数据集中图像与标签的关系,构建标签关系矩阵,对其进行非负矩阵分解,得到标签的社团关系矩阵,令Wn×k表示标签节点所属社团关系矩阵,对于第i个标签节点,多标签社团的结点贡献比表示为其中n表示标签总数,Ci表示标签对构成各个社团的支持力度,wij表示标签所属社团的关系矩阵中第i个标签的贡献,k表示社团个数;

步骤2:根据标签间的社团关系及各个标签的重要性程度对候选标签排序,从排序结果选择排序前5的标签作为最终标签结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911286325.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top