[发明专利]一种基于图像检索的字幕匹配方法和系统有效
| 申请号: | 201510212026.7 | 申请日: | 2015-04-29 |
| 公开(公告)号: | CN104794223B | 公开(公告)日: | 2018-06-01 |
| 发明(设计)人: | 张伟;曾志勇;张长定;傅松林 | 申请(专利权)人: | 厦门美图之家科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 361008 福建省厦*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本图像 匹配图像 匹配 哈希函数 汉明距离 图像检索 网络训练 字幕内容 自编码 字幕 检索 二进制编码序列 相似图像检索 图像 二进制编码 图像二进制 编码转换 快速精准 图像字幕 采集 赋予 保证 | ||
1.一种基于图像检索的字幕匹配方法,其特征在于,包括以下步骤:
10:采集样本图像及其对应的字幕内容,并使用样本图像作为ELM自编码网络的训练数据,通过训练得到哈希函数,并使用该哈希函数进行图像二进制编码转换,得到各个样本图像的二进制编码序列;
20:获取待匹配图像,对待匹配图像使用ELM自编码网络训练得到哈希函数,并使用该哈希函数进行图像二进制编码转换,得到待匹配图像的二进制编码序列;
30:根据待匹配图像的二进制编码序列和各个样本图像的二进制编码序列计算图像之间的汉明距离,并根据该汉明距离通过K近邻法进行相似图像检索,得到与待匹配图像最相似样本图像;
40:将所述的最相似样本图像所对应的字幕内容赋予所述的待匹配图像。
2.根据权利要求1所述的一种基于图像检索的字幕匹配方法,其特征在于:所述的样本图像主要是指包含字幕内容的影视图像,该影视图像包括电影截图或电视剧截图,各个影视图像都设置有对应的字幕内容和对应的二进制编码序列。
3.根据权利要求1所述的一种基于图像检索的字幕匹配方法,其特征在于:所述的步骤10中,将各个样本图像分别应用ELM自编码网络训练得到哈希函数,并使用该哈希函数进行图像二进制编码转换,得到各个样本图像的二进制编码序列,进一步包括以下步骤:
a1.通过获取样本图像作为训练的数据集合,并以该数据集合作为ELM自编码网络的输入,进行哈希函数的训练,得到哈希自编码模型;
b1.在ELM自编码训练过程中,求解各个样本图像的最佳匹配的哈希函数,并将该最佳匹配的哈希函数作为优化哈希函数;
c1.使用所述的优化哈希函数进行图像二进制编码转换,得到各个样本图像的二进制编码序列。
4.根据权利要求3所述的一种基于图像检索的字幕匹配方法,其特征在于:所述的步骤20中,对待匹配图像使用ELM自编码网络训练得到哈希函数,并使用该哈希函数进行图像二进制编码转换,得到待匹配图像的二进制编码序列,进一步包括以下步骤:
a2.将所述的待匹配图像作为ELM自编码网络的输入,求解该待匹配图像的最佳匹配的哈希函数,并将该最佳匹配的哈希函数作为优化哈希函数;
b2.使用所述的优化哈希函数进行图像二进制编码转换,得到待匹配图像的二进制编码序列。
5.根据权利要求3或4所述的一种基于图像检索的字幕匹配方法,其特征在于:所述的优化哈希函数的计算方法,进一步包括以下步骤:
ba1.预设所述的样本图像作为训练的数据集合是一个包含N个D维向量的数据X
ba2.用0或1随机初始化N个L维向量的数据Z
ba3.对于Z
H=sigmod(WX+b),且W,b使用随机初始化;
ba4.求解获得hash函数,hash
ba5.对于X中的N个样本中的每个样本n,使用ELM自编码求解X
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司,未经厦门美图之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510212026.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于远程射雾空气净化设备上的喷头
- 下一篇:一种用于旋流器的陶瓷内壁





