[发明专利]一种基于大规模词典迁移的词典构造方法有效
| 申请号: | 201610513668.5 | 申请日: | 2016-06-30 |
| 公开(公告)号: | CN106203445B | 公开(公告)日: | 2019-05-07 |
| 发明(设计)人: | 杜强;许正;丁占阳 | 申请(专利权)人: | 北京小白世纪网络科技有限公司 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06F16/50 |
| 代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 马东瑞 |
| 地址: | 100094 北京市海淀区西北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于大规模词典迁移的词典构造方法,包括如下步骤:步骤S1:提取目标数据集图像的局部特征;步骤S2:根据原始的视觉词典,对所述局部特征进行特征量化;步骤S3:根据特征量化结果构造目标函数;步骤S4:优化目标函数。本发明提出的一种基于大规模词典迁移的词典构造方法能够在图像集之间为复数域的情况下,为目标图像集构造准确的视觉词典,从而保证在海量数据集、新数据不断出现的环境下,能快速、准确地迁移视觉词典。 | ||
| 搜索关键词: | 一种 基于 大规模 词典 迁移 构造 方法 | ||
【主权项】:
1.一种基于大规模词典迁移的词典构造方法,其特征在于,包括如下步骤:步骤S1:提取目标数据集图像的局部特征;步骤S2:根据原始的视觉词典,对所述局部特征进行特征量化;步骤S3:根据所述步骤S2的特征量化结果构造目标函数;步骤S4:优化所述目标函数;所述步骤S1:提取目标数据集图像的局部特征的步骤中,具体包括如下步骤:步骤S1.1:提取目标数据集图像的局部特征向量,图像的局部特征向量表示为:
其中
,其中
表示第m个局部特征向量中的地nm个分量;步骤S1.2:对所述局部特征向量的每一个维度进行归一化处理;所述步骤S1中,利用V1feat或inria工具提取目标数据集图像的局部特征向量;所述步骤S2:根据原始的视觉词典,对所述局部特征进行特征量化的步骤中,包括如下步骤:通过K最邻近的方法创建目标数据集的图像特征表示,所述图像特征表示为acj=(ac1,ac2,…,acr),其中,acj(j=1,2,…,r)表示原始的视觉词典中视觉词汇在图像上的分布数量;所述步骤S2:根据原始的视觉词典,对所述局部特征进行特征量化的步骤中,包括如下步骤:步骤S2.1:找到目标数据集图像的局部特征在特征空间中所述视觉词典的视觉词汇的最近邻;步骤S2.2:每当寻得一个所述最近邻,则在所述最近邻对应的局部特征向量位上加1或者按照预定规则计算权重,最后得到图像特征表示;所述步骤S3中的构造的目标函数为:
其中xj为局部特征点;ci为视觉词汇对应的特征点聚类簇的聚类中心;
为ci对应的视觉词汇频率,所述视觉词汇频率TA为一个视觉词汇在特征量化中作为最近邻的次数;μ和α分别为视觉词汇频率分布TAF的平均值和方差,所述视觉词汇频率分布TAF为具有相同视觉词汇频率TA的视觉词汇的数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小白世纪网络科技有限公司,未经北京小白世纪网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610513668.5/,转载请声明来源钻瓜专利网。





