[发明专利]一种基于属性判别的自动图像标注方法有效
申请号: | 201610036626.7 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105701516B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 柯逍;周铭柯;杜明智 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于属性判别的自动图像标注方法:针对数据集不均衡导致整体标注效果不理想的问题,提出一种基于属性判别的图像标注方法,利用每一个关键词的语义概念构建局部均衡数据集,并基于此数据集提出一种有效提升中低频标签标注准确率的语义传播算法。最后结合栈式自动编码器模型,通过判别图像的高低频属性来选择不同标注过程,提升了整体图像标注效果。该方法利用SAE模型较好预测高频标签和SP算法较好预测中低频标签的特点,通过判别未知图像的高低频属性来选择不同的标注过程,提升了整个模型的标注效果,该方法简单灵活,具有较强的实用性。 | ||
搜索关键词: | 一种 基于 属性 别的 自动 图像 标注 方法 | ||
【主权项】:
1.一种基于属性判别的自动图像标注方法,其特征在于,按照如下步骤实现:步骤S1:根据每一个关键词对训练集划分语义组,构造未知图像的局部均衡数据集;步骤S2:利用整个训练集训练栈式自动编码器,获取栈式自动编码器模型;步骤S3:利用所述局部均衡数据集训练语义传播模型;步骤S4:从所述语义组中获得全局词频信息,从所述局部均衡数据集中获得局部词频信息,对所述全局词频信息以及所述局部词频信息取交集对未知图像进行属性判别;若判别未知图像为高频属性,则通过所述栈式自动编码器模型预测关键词;若判别未知图像为低频属性,则通过所述语义传播模型预测关键词;在所述步骤S3中,还包括如下步骤:步骤S31:构建语义传播求解模型,令G={(y1,X1),(y2,X2),...,(yM,XM)},yi表示关键词,Xi表示每一个关键词以及该关键词所包含的所有图像,Xi和Xj中的图像可重复,i,j∈{1,...,M},i≠j;用条件概率P(x|yi)建立给定关键词yi∈Y的输入图像x的特征分布,将图像标注转化为求解后验概率的问题:
其中,P(yi)和P(x)为先验概率,取固定值;对于测试图像I,其最佳标签为:
步骤S32:求解传播模型的后验概率,令Gi=(yi,Xi),对于测试图像I,从Gi中的Xi中挑选n幅与测试图像I视觉距离最近的图像构成子集
每一个集合GI,i是测试图像I对应于标签yi的语义组;确定GI,i后,合并为一个集合GI={GI,1∪...∪GI,M},且各GI,i间的关键词不同,但有相同的图像,得到进而针对测试图像I的局部均衡数据集
步骤S33:在集合GI中的每一个关键词都将出现n次,定义给定标签yk∈Y的图像I的后验概率:
其中,P(yk|xi)∈{0,1}表示当图像xi所在语义组GI,i的语义概念等于标签yk时为1,否则为0,
表示图像xi的权重,并按如下方式计算:
其中,Dis(I,xi)表示图像I和xi间的欧式距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610036626.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种显示器的背板、显示器的壳体以及显示器
- 下一篇:一种版权交易可翻折显示屏