[发明专利]基于跨媒体稀疏主题编码的图像自动标注方法在审
申请号: | 201711242488.9 | 申请日: | 2017-11-30 |
公开(公告)号: | CN107943985A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 刘均;宋凌云;罗敏楠;杨宽;张玲玲;阮建飞 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;H03M7/30 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于跨媒体稀疏主题编码的图像自动标注方法,先由多媒体文档中的图像生成图像词,并利用词袋模型将多媒体文档中的注释词表示成向量,得到处理后的多媒体文档;根据处理后的多媒体文档和概率主题模型,获得图像跨媒体稀疏主题编码模型;利用最大后验概率估计方法,获得多媒体文档中图像词、注释词和两者的关系编码变量的联合分布式,并采用拉普拉斯先验和超高斯对联合分布式中的图像词编码、多媒体文档编码以及关系编码进行建模;使用坐标下降法对跨媒体稀疏主题编码模型进行优化求解,之后计算图像编码和注释词编码之间的余弦相似度进行图像标注。本发明标注时间和空间复杂度降低,在保证图像标注准确率的同时保证效率。 | ||
搜索关键词: | 基于 媒体 稀疏 主题 编码 图像 自动 标注 方法 | ||
【主权项】:
基于跨媒体稀疏主题编码的图像自动标注方法,其特征在于:包括以下步骤:步骤1、多媒体文档的定义及表示:多媒体文档由一张图像和注释词组成,由图像生成图像词,并利用词袋模型将多媒体文档中的注释词表示成向量,得到处理后的多媒体文档;步骤2、跨媒体稀疏主题编码模型构建:根据处理后的多媒体文档和概率主题模型,获得图像跨媒体稀疏主题编码模型;步骤3、利用最大后验概率估计方法,获得多媒体文档中图像词、注释词和两者的关系编码变量的联合分布式,并采用拉普拉斯先验和超高斯对联合分布式中的图像词编码S、多媒体文档编码θ以及关系编码Y进行建模;步骤4、使用坐标下降法对提出的跨媒体稀疏主题编码模型进行优化求解,之后计算图像编码和注释词编码之间的余弦相似度进行图像标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711242488.9/,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法、装置、计算机设备和计算机可读存储介质
- 下一篇:暖手宝