[发明专利]一种基于机器学习的GIF格式图片搜索方法在审
| 申请号: | 201910298627.2 | 申请日: | 2019-04-15 |
| 公开(公告)号: | CN110287348A | 公开(公告)日: | 2019-09-27 |
| 发明(设计)人: | 薛景;张政;廖芷瑄;朱知萌 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/953;G06N3/04 |
| 代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关键帧 图片搜索 预处理 卷积神经网络 哈希值信息 基础数据库 搜索 基于机器 核函数 图片 哈希 数据训练 图片存放 图片检索 最佳匹配 预测 使用率 构建 切割 查找 学习 分类 创建 网络 | ||
1.一种基于机器学习的GIF格式图片检索方法,其特征在于,包括如下步骤,
步骤S1、获取网络中的GIF图片,并对GIF图片进行预处理;
步骤S2、切割预处理后的GIF图片,提取出其中的关键帧,计算出关键帧的哈希值,并将生成的哈希值信息与GIF图片存放至基础数据库;
步骤S3、构建卷积神经网络模型,利用基础数据库中的数据训练卷积神经网络模型,获取用于预测的核函数;
步骤S4、将待搜索的目标GIF图片拆分,并提取关键帧,再将提取到的关键帧代入核函数进行计算,获取最佳匹配种类;
步骤S5、计算出待搜索的目标GIF图片的关键帧的哈希值,并利用哈希值信息在已预测的种类里查找相似的图片,若没有。则在当前类别中创建新的分类。
2.根据权利要求1所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述步骤S1中,使用爬虫程序从互联网中爬取GIF图片资源,并对每一张图片进行裁剪,裁剪大小为256×256,并将裁剪好的图片储存在数据库中。
3.根据权利要求1所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述步骤S2中,从切割预处理后的GIF图片中提取出一系列静态帧,静态帧中存在大量的重复和相似,首先排除GIF图片中的动态细节,再留下静态帧中所包含的主题和内容,提取出其中清晰度最高、最能描述镜头内容的帧作为关键帧。
4.根据权利要求1或3所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,从所述关键帧中提取颜色、纹理和形状特征信息作为视频摘要和基础数据库索引的数据源。
5.根据权利要求1所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述关键帧的提取方法为具体为:
在Python 3.x的环境中,使用PIL库中的image类逐帧读取GIF图片,判断当前读取的帧是否为读取的上一帧的一部分,若不是,则保存当前帧并将其压缩成256×256大小;
对比压缩后的当前帧与上一保存的帧的像素,并将当前帧和上一保存帧的像素做差,再取绝对值求和;保存差值,并对差值做平滑处理,最后根据阈值从差值中选取具有代表性的关键帧。
6.根据权利要求5所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述平滑处理所使用的平滑离散函数为汉宁窗函数,其公式为:
其中,汉宁窗作为3个sinc(t)函数之和,而括号中的两项相对于第一个谱窗向左右各移动了π/t,从而旁瓣相互抵消,消去了高频干扰和漏能。
7.根据权利要求1所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述步骤S3中,所述卷积神经网络按结构分为六层;
第一层为输入层,预处理时将图片压缩为256×256大小,若输入的是黑白照片,则输入的是256×256的二维神经元;若输入的是RBG彩色图片,则输入的是256×256的三维神经元;
第二层为卷积层,对图像和滤波矩阵做内积;
第三层为激励层,激励层对卷积层的输出进行一个非线性映射,一般使用Rule函数:f(x)=max(x,o);
第四层为池化层,对图像通过卷积层获得的特征图进行降维操作,输出深度不变;
第五层为全连接层,对特征图的特征进行重新拟合,减少特征信息的丢失;
第六层为输出层,输出用于计算图像特征值的核函数。
8.根据权利要求1所述的一种基于机器学习的GIF格式图片检索方法,其特征在于,所述步骤S2中,将拆分出的关键帧经卷积后得到的图像特征值存储至基础数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910298627.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:采用大数据检测电力机房故障的方法
- 下一篇:图形生成方法、装置、介质及终端





