[发明专利]一种基于地点的多模态媒体数据主题提取模型有效
申请号: | 201610202586.9 | 申请日: | 2016-03-31 |
公开(公告)号: | CN105893573B | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 刘安安;师阳;聂为之;苏育挺 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/487 | 分类号: | G06F16/487;G06F16/432 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于地点的多模态媒体数据主题提取模型:将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库;对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取,得到初始文本特征向量集;采用颜色特征对每个地点的多媒体图像数据进行处理得到初始图像特征向量集;将所有地点的初始文本特征向量集和初始图像特征向量集进行集合定义为多模态媒体数据特征库;得到多模态媒体数据在同一空间下的特征向量集;得到基于地点的多模态媒体数据主题模型,计算主题模型中图像特征和文本特征之间的欧氏距离,实现对多媒体图像数据的文本标注。本发明避免了多媒体数据的模态单一性,实现了基于地点的多模态媒体数据的主题提取。 | ||
搜索关键词: | 一种 基于 地点 多模态 媒体 数据 主题 提取 模型 | ||
【主权项】:
1.一种基于地点的多模态媒体数据主题提取模型,其特征在于,包括以下步骤:1)采集各个地点的多媒体图像数据和文本数据,得到各地点的初始多模态媒体数据集,将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库;2)在多模态媒体数据库中,对每个地点的文本数据进行自然语言处理后采用词袋模型得到文本中前1000~1500个单词,对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取,去噪后得到初始文本特征向量集
其中N2为初始文本特征向量集中文本数据的数目,m2为特征的维度;3)在多模态媒体数据库中,采用颜色特征对每个地点的多媒体图像数据进行处理,再经过三层贝叶斯概率模型处理、去噪后得到初始图像特征向量集
其中N1为初始图像特征向量集中图像数据的数目,m1为特征的维度;4)将所有地点的初始文本特征向量集和初始图像特征向量集进行集合,将其定义为多模态媒体数据特征库;5)以多模态媒体数据特征库作为模型的输入,初始化模型参数,构建多模态媒体数据图结构,得到多模态媒体数据在同一空间下的特征向量集;包括:(1)根据初始图像特征向量集
和初始文本特征向量集
得到多模态媒体数据在同一空间下的特征向量集和特征映射之间的误差值关系式:
其中:设定
其中
U1是X1转换到V1的近似的过渡矩阵,U2是X2转换到V2的近似的过渡矩阵;
I为单位矩阵,O为零矩阵,n0为Flickr图像数据的数量,n1为Foursquare图像数据的数量,n2为Foursquare文本数据的数量,D为对角矩阵;
(A1)es代表图像e和图像s的相似度,(V1)e为图像e的跨域特征,(V1)s为图像s的跨域特征,L1是拉普拉斯算子;
(A2)es代表文本e和文本s的相似度,(V2)e为文本e的跨域特征,(V2)s为文本s的跨域特征,L2是拉普拉斯算子;λ1、λ2、μ、α1、α2和γ为模型参数;
其中d为要得到的特征映射的维度;(2)对误差值关系式中的λ1、λ2、μ、α1、α2、V1和V2初始化;(3)分别固定U1、U2、V1和V2并求导,不断重复求导过程直到误差值关系式具有设定的最小值,此时的V1和V2即为多模态媒体数据的特征映射,即不同模态数据在同一特征空间下的特征向量集;6)对得到的特征向量集进行K均值聚类,得到基于地点的多模态媒体数据主题模型,计算主题模型中图像特征和文本特征之间的欧氏距离,实现对多媒体图像数据的文本标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610202586.9/,转载请声明来源钻瓜专利网。