[发明专利]一种基于地点的多模态媒体数据主题提取模型有效

专利信息
申请号: 201610202586.9 申请日: 2016-03-31
公开(公告)号: CN105893573B 公开(公告)日: 2019-07-23
发明(设计)人: 刘安安;师阳;聂为之;苏育挺 申请(专利权)人: 天津大学
主分类号: G06F16/487 分类号: G06F16/487;G06F16/432
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 杜文茹
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于地点的多模态媒体数据主题提取模型:将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库;对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取,得到初始文本特征向量集;采用颜色特征对每个地点的多媒体图像数据进行处理得到初始图像特征向量集;将所有地点的初始文本特征向量集和初始图像特征向量集进行集合定义为多模态媒体数据特征库;得到多模态媒体数据在同一空间下的特征向量集;得到基于地点的多模态媒体数据主题模型,计算主题模型中图像特征和文本特征之间的欧氏距离,实现对多媒体图像数据的文本标注。本发明避免了多媒体数据的模态单一性,实现了基于地点的多模态媒体数据的主题提取。
搜索关键词: 一种 基于 地点 多模态 媒体 数据 主题 提取 模型
【主权项】:
1.一种基于地点的多模态媒体数据主题提取模型,其特征在于,包括以下步骤:1)采集各个地点的多媒体图像数据和文本数据,得到各地点的初始多模态媒体数据集,将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库;2)在多模态媒体数据库中,对每个地点的文本数据进行自然语言处理后采用词袋模型得到文本中前1000~1500个单词,对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取,去噪后得到初始文本特征向量集其中N2为初始文本特征向量集中文本数据的数目,m2为特征的维度;3)在多模态媒体数据库中,采用颜色特征对每个地点的多媒体图像数据进行处理,再经过三层贝叶斯概率模型处理、去噪后得到初始图像特征向量集其中N1为初始图像特征向量集中图像数据的数目,m1为特征的维度;4)将所有地点的初始文本特征向量集和初始图像特征向量集进行集合,将其定义为多模态媒体数据特征库;5)以多模态媒体数据特征库作为模型的输入,初始化模型参数,构建多模态媒体数据图结构,得到多模态媒体数据在同一空间下的特征向量集;包括:(1)根据初始图像特征向量集和初始文本特征向量集得到多模态媒体数据在同一空间下的特征向量集和特征映射之间的误差值关系式:其中:设定其中U1是X1转换到V1的近似的过渡矩阵,U2是X2转换到V2的近似的过渡矩阵;I为单位矩阵,O为零矩阵,n0为Flickr图像数据的数量,n1为Foursquare图像数据的数量,n2为Foursquare文本数据的数量,D为对角矩阵;(A1)es代表图像e和图像s的相似度,(V1)e为图像e的跨域特征,(V1)s为图像s的跨域特征,L1是拉普拉斯算子;(A2)es代表文本e和文本s的相似度,(V2)e为文本e的跨域特征,(V2)s为文本s的跨域特征,L2是拉普拉斯算子;λ1、λ2、μ、α1、α2和γ为模型参数;其中d为要得到的特征映射的维度;(2)对误差值关系式中的λ1、λ2、μ、α1、α2、V1和V2初始化;(3)分别固定U1、U2、V1和V2并求导,不断重复求导过程直到误差值关系式具有设定的最小值,此时的V1和V2即为多模态媒体数据的特征映射,即不同模态数据在同一特征空间下的特征向量集;6)对得到的特征向量集进行K均值聚类,得到基于地点的多模态媒体数据主题模型,计算主题模型中图像特征和文本特征之间的欧氏距离,实现对多媒体图像数据的文本标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610202586.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top