[发明专利]一种基于实体映射的异构媒体相似性计算方法及检索方法有效
申请号: | 201610003735.9 | 申请日: | 2016-01-04 |
公开(公告)号: | CN105677830B | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 黄雷;彭宇新 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/40 | 分类号: | G06F16/40;G06F16/43 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于实体映射的异构媒体相似性计算方法及检索方法,包括以下步骤:建立包含不同模态媒体数据的异构媒体数据库,提取不同模态媒体数据的特征向量;构建实体层,作为从底层特征到高层语义之间的过渡;考虑单一模态媒体数据以及不同模态媒体数据之间的关联,学习得到实体映射,进而得到不同模态媒体数据在实体层的统一表示;生成语义抽象,得到高层语义概念的概率向量表示,最终得到异构媒体相似性计算结果用于异构媒体检索。本发明构建了具有明确语义的实体层作为从底层特征到高层语义的过渡桥梁,减少了高层语义概念的歧义性,使得不同模态媒体数据能够互相促进,提高相似性计算的准确性,从而取得更高的异构媒体检索准确率。 | ||
搜索关键词: | 一种 基于 实体 映射 媒体 相似性 计算方法 检索 方法 | ||
【主权项】:
1.一种基于实体映射的异构媒体相似性计算方法,包括以下步骤:(1)建立包含不同模态媒体数据的异构媒体数据库,并标注一定数量的异构媒体数据作为训练集,提取不同模态媒体数据的特征向量;(2)对训练集数据提取并筛选实体,构建实体层,作为从底层特征到高层语义之间的中间层;所述对训练集数据提取并筛选实体,首先采用实体抽取工具得到实体集合,再通过互信息特征选择算法计算实体包含分类信息的大小,进行实体的排序筛选;(3)利用训练集的不同模态媒体数据的特征向量以及对应的标注,考虑单一模态媒体数据以及不同模态媒体数据之间的关联,学习得到实体映射,进而得到不同模态媒体数据在实体层的统一表示;(4)在实体层的统一表示基础上生成语义抽象,得到高层语义概念的概率向量表示,最终得到异构媒体相似性计算结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610003735.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多维渐增数据模型的数据查询方法
- 下一篇:一种网页书签添加方法及终端