[发明专利]基于线性泛化回归模型的跨媒体检索方法有效
申请号: | 201210171539.4 | 申请日: | 2012-05-29 |
公开(公告)号: | CN102693316A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 谭铁牛;王亮;陈永明 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线性 泛化 回归 模型 媒体 检索 方法 | ||
1.一种基于线性泛化回归模型的跨媒体检索方法,其特征在于,该方法包括以下步骤:
步骤1,搜集不同模态的样本,建立跨模态检索数据库,并提取数据库中不同模态样本的特征向量;
步骤2,利用线性泛化回归模型来估计不同模态样本特征向量之间的关联矩阵;
步骤3,估计数据库中各个样本的特征向量属于某一个类别的后验概率;
步骤4,用户输入待检索对象,并根据待检索对象的类型进行相应的特征提取;
步骤5,使用所述关联矩阵对提取到的待检索对象的特征进行特征转换;
步骤6,计算待检索对象转换后的特征与数据库中对应类别的样本对象的特征之间的相似度;
步骤7,根据所述步骤6计算得到的相似度对数据库中对应类别的样本对象进行排序,并返回其中最相似的几个样本对象作为跨媒体检索结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中,所述不同模态的样本之间为一一对应。
3.根据权利要求1所述的方法,其特征在于,分别使用尺度不变特征变换算法和隐狄雷克雷分布算法对图像和文本进行特征的提取。
4.根据权利要求1所述的方法,其特征在于,所述线性泛化回归模型表示为:
Y=XB+E,
其中,X和Y分别代表两个不同模态的特征向量,B为X和Y之间的关联矩阵,E为残差矩阵。
5.根据权利要求1所述的方法,其特征在于,所述步骤3中,采用多类Logistic回归算法来估计数据库中各个样本的特征向量属于某一个类别i的后验概率:
其中,i表示类别,x是特征向量,w是特征向量x的权重,通过最大似然估计法学习得到。
6.根据权利要求1所述的方法,其特征在于,所述步骤5中,使用所述关联矩阵对提取到的待检索对象的特征进行特征转换表示为:
其中,为待检索对象的特征,B为关联矩阵,为转换后得到的特征。
7.根据权利要求1所述的方法,其特征在于,若数据库中含有多个模态对象,则根据相应的关联矩阵对待检索对象特征进行转换。
8.根据权利要求1所述的方法,其特征在于,所述步骤5中进一步包括,利用多类Logistic回归算法估计转换后的待检索对象特征属于某一个类别的后验概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210171539.4/1.html,转载请声明来源钻瓜专利网。