[发明专利]一种基于图像检索的字幕匹配方法和系统有效

申请号：	201510212026.7	申请日：	2015-04-29
公开（公告）号：	CN104794223B	公开（公告）日：	2018-06-01
发明（设计）人：	张伟;曾志勇;张长定;傅松林	申请（专利权）人：	厦门美图之家科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	361008 福建省厦***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	样本图像匹配图像匹配哈希函数汉明距离图像检索网络训练字幕内容自编码字幕检索二进制编码序列相似图像检索图像二进制编码图像二进制编码转换快速精准图像字幕采集赋予保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图像检索的字幕匹配方法，其特征在于，包括以下步骤：

10：采集样本图像及其对应的字幕内容，并使用样本图像作为ELM自编码网络的训练数据，通过训练得到哈希函数，并使用该哈希函数进行图像二进制编码转换，得到各个样本图像的二进制编码序列；

20：获取待匹配图像，对待匹配图像使用ELM自编码网络训练得到哈希函数，并使用该哈希函数进行图像二进制编码转换，得到待匹配图像的二进制编码序列；

30：根据待匹配图像的二进制编码序列和各个样本图像的二进制编码序列计算图像之间的汉明距离，并根据该汉明距离通过K近邻法进行相似图像检索，得到与待匹配图像最相似样本图像；

40：将所述的最相似样本图像所对应的字幕内容赋予所述的待匹配图像。

2.根据权利要求1所述的一种基于图像检索的字幕匹配方法，其特征在于：所述的样本图像主要是指包含字幕内容的影视图像，该影视图像包括电影截图或电视剧截图，各个影视图像都设置有对应的字幕内容和对应的二进制编码序列。

3.根据权利要求1所述的一种基于图像检索的字幕匹配方法，其特征在于：所述的步骤10中，将各个样本图像分别应用ELM自编码网络训练得到哈希函数，并使用该哈希函数进行图像二进制编码转换，得到各个样本图像的二进制编码序列，进一步包括以下步骤：

a1.通过获取样本图像作为训练的数据集合，并以该数据集合作为ELM自编码网络的输入，进行哈希函数的训练，得到哈希自编码模型；

b1.在ELM自编码训练过程中，求解各个样本图像的最佳匹配的哈希函数，并将该最佳匹配的哈希函数作为优化哈希函数；

c1.使用所述的优化哈希函数进行图像二进制编码转换，得到各个样本图像的二进制编码序列。

4.根据权利要求3所述的一种基于图像检索的字幕匹配方法，其特征在于：所述的步骤20中，对待匹配图像使用ELM自编码网络训练得到哈希函数，并使用该哈希函数进行图像二进制编码转换，得到待匹配图像的二进制编码序列，进一步包括以下步骤：

a2.将所述的待匹配图像作为ELM自编码网络的输入，求解该待匹配图像的最佳匹配的哈希函数，并将该最佳匹配的哈希函数作为优化哈希函数；

b2.使用所述的优化哈希函数进行图像二进制编码转换，得到待匹配图像的二进制编码序列。

5.根据权利要求3或4所述的一种基于图像检索的字幕匹配方法，其特征在于：所述的优化哈希函数的计算方法，进一步包括以下步骤：

ba1.预设所述的样本图像作为训练的数据集合是一个包含N个D维向量的数据XDxN＝(x1,…xN)；

ba2.用0或1随机初始化N个L维向量的数据ZLxN＝(z1,…zN)，即编码长度为L的样本图像的二进制编码序列，并开始u次迭代；

ba3.对于ZLxN中的第l维编码数值，应有ELM的方法解HB＝ZN，l，其中，

H＝sigmod(WX+b)，且W，b使用随机初始化；

ba4.求解获得hash函数，hashN,l(X)＝HB；

ba5.对于X中的N个样本中的每个样本n，使用ELM自编码求解Xn＝f(Zn)，迭代训练直到Z＝hash(X)停止，该哈希函数Z＝hash(X)即为优化哈希函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司，未经厦门美图之家科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510212026.7/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载