[发明专利]一种基于地点的多模态媒体数据主题提取模型有效

申请号：	201610202586.9	申请日：	2016-03-31
公开（公告）号：	CN105893573B	公开（公告）日：	2019-07-23
发明（设计）人：	刘安安;师阳;聂为之;苏育挺	申请（专利权）人：	天津大学
主分类号：	G06F16/487	分类号：	G06F16/487;G06F16/432
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	杜文茹
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于地点的多模态媒体数据主题提取模型：将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库；对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取，得到初始文本特征向量集；采用颜色特征对每个地点的多媒体图像数据进行处理得到初始图像特征向量集；将所有地点的初始文本特征向量集和初始图像特征向量集进行集合定义为多模态媒体数据特征库；得到多模态媒体数据在同一空间下的特征向量集；得到基于地点的多模态媒体数据主题模型，计算主题模型中图像特征和文本特征之间的欧氏距离，实现对多媒体图像数据的文本标注。本发明避免了多媒体数据的模态单一性，实现了基于地点的多模态媒体数据的主题提取。
搜索关键词：	一种基于地点多模态媒体数据主题提取模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于地点的多模态媒体数据主题提取模型，其特征在于，包括以下步骤：1)采集各个地点的多媒体图像数据和文本数据，得到各地点的初始多模态媒体数据集，将所有地点的多模态媒体数据集和文本数据总体定义为基于地点的多模态媒体数据库；2)在多模态媒体数据库中，对每个地点的文本数据进行自然语言处理后采用词袋模型得到文本中前1000～1500个单词，对经过自然语言处理后的文本数据进行三层贝叶斯概率模型的提取，去噪后得到初始文本特征向量集其中N₂为初始文本特征向量集中文本数据的数目，m₂为特征的维度；3)在多模态媒体数据库中，采用颜色特征对每个地点的多媒体图像数据进行处理，再经过三层贝叶斯概率模型处理、去噪后得到初始图像特征向量集其中N₁为初始图像特征向量集中图像数据的数目，m₁为特征的维度；4)将所有地点的初始文本特征向量集和初始图像特征向量集进行集合，将其定义为多模态媒体数据特征库；5)以多模态媒体数据特征库作为模型的输入，初始化模型参数，构建多模态媒体数据图结构，得到多模态媒体数据在同一空间下的特征向量集；包括：(1)根据初始图像特征向量集和初始文本特征向量集得到多模态媒体数据在同一空间下的特征向量集和特征映射之间的误差值关系式：其中：设定其中U₁是X₁转换到V₁的近似的过渡矩阵，U₂是X₂转换到V₂的近似的过渡矩阵；I为单位矩阵，O为零矩阵，n₀为Flickr图像数据的数量，n₁为Foursquare图像数据的数量，n₂为Foursquare文本数据的数量，D为对角矩阵；(A₁)_es代表图像e和图像s的相似度，(V₁)_e为图像e的跨域特征，(V₁)_s为图像s的跨域特征，L₁是拉普拉斯算子；(A₂)_es代表文本e和文本s的相似度，(V₂)_e为文本e的跨域特征，(V₂)_s为文本s的跨域特征，L₂是拉普拉斯算子；λ₁、λ₂、μ、α₁、α₂和γ为模型参数；其中d为要得到的特征映射的维度；(2)对误差值关系式中的λ₁、λ₂、μ、α₁、α₂、V₁和V₂初始化；(3)分别固定U₁、U₂、V₁和V₂并求导，不断重复求导过程直到误差值关系式具有设定的最小值，此时的V₁和V₂即为多模态媒体数据的特征映射，即不同模态数据在同一特征空间下的特征向量集；6)对得到的特征向量集进行K均值聚类，得到基于地点的多模态媒体数据主题模型，计算主题模型中图像特征和文本特征之间的欧氏距离，实现对多媒体图像数据的文本标注。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610202586.9/，转载请声明来源钻瓜专利网。

上一篇：一种结合标签数据的二部图模型学术论文推荐方法
下一篇：一种目标数据输出方法、装置及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于地点的多模态媒体数据主题提取模型有效

专利文献下载