[发明专利]基于视觉和标注字相关信息的标注图像场景聚类方法有效
申请号: | 201110148760.3 | 申请日: | 2011-06-03 |
公开(公告)号: | CN102222239A | 公开(公告)日: | 2011-10-19 |
发明(设计)人: | 刘咏梅 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明提供的是一种基于视觉和标注字相关信息的标注图像场景聚类方法。采用NCut图像分割算法分别对训练图像和测试图像进行分割;构造用于学习的所有图像{J1,·,Jl}PCtrain的视觉最近邻图 |
||
搜索关键词: | 基于 视觉 标注 相关 信息 图像 场景 方法 | ||
【主权项】:
一种基于视觉和标注字相关信息的标注图像场景聚类方法,其特征是:步骤1,采用NCut图像分割算法分别对训练图像和测试图像进行分割,获得图像区域的视觉描述;步骤2,构造用于学习的所有图像{J1,·,Jl}∈Ctrain的视觉最近邻图G=(V,E),顶点集V对应各个图像,每一个顶点对应一幅图像,边集E代表图像间的视觉距离;对图像间的视觉距离采用多区域集成匹配的相似性测度即EMD,连接两个顶点的边上的权值对应图像间的EMD视觉距离;步骤3,在训练图像集中,每幅图像有一组初始的归一化标注字权值向量,初始标注字权值向量的归一化方法是统计全部标注字在该图像中出现的频度;步骤4,令每幅训练图像的标注字在视觉最近邻间传播,接受的图像按照它们之间归一化的EMD距离的程度来接收,EMD距离的归一化方法见公式为 Emd nor = e - Emd δ 其中,Emd代表图像间的EMD距离,Emdnor表示归一化EMD距离,δ是经验参数,取训练图像集的EMD方差;步骤5,对每幅训练图像,将累积完毕的标注字权值再进行归一化;步骤6,在图像的视觉特征被转换为一组带有权值的标注字后,采用PLSA模型进行场景语义聚类;步骤7,利用高斯混合模型对各个场景语义视觉空间的进行学习;步骤8,对测试图像,利用视觉特征进行场景归类,并直接利用该场景语义获得相应的标注字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110148760.3/,转载请声明来源钻瓜专利网。