[发明专利]一种基于深度学习的文物艺术品领域图像相似度度量方法有效
申请号: | 202010319027.2 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111523592B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 蒋齐琛;周圆;王中恕;闫倩;祁煜琨;郑洁 | 申请(专利权)人: | 易元数字(北京)科技集团有限公司 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/40;G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京智行阳光知识产权代理事务所(普通合伙) 11738 | 代理人: | 黄锦阳 |
地址: | 100000 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 文物 艺术品 领域 图像 相似 度量 方法 | ||
本发明公开了一种基于深度学习的文物艺术品领域图像相似度度量算法,在caffe深度学习框架下进行实现。由于本发明涉及领域与大众领域稍有不同,目前尚未见到关于文物艺术品领域大型数据集,因此本实验数据集为自行人工标注的数据集,一共涉及绘画、书法、瓷器、贝器、名人手迹、青铜器、石器、玉器、唐卡、文房用具、竹木牙角匏器、紫砂器、碑帖拓片、珐琅器、佛像、古典家具、古乐器、古钱币、骨器、金属器、料器、漆器共22个分类,总计两百多万张图片数据,训练集与测试集比例为4:1。训练数据统一归一化到长、宽均为256像素尺寸,并通过镜面翻转、随机剪裁、小角度旋转、椒盐噪声等常见图片处理方式进行数据扩充至8~10倍。
技术领域
本发明属于图像相似度度量领域,更具体的说,涉及一种通过卷积神经网络提取图片特征,随后完成图片对之间的特征距离计算,进而转化为相似度数值的方法。
背景技术
科技的发展革新为日常生产生活带来了巨大的影响。计算机、互联网行业的蓬勃发展,为我们带来了海量数据,不得不承认,身处于大数据时代,无论哪个行业都有着将数据转化为效率和应用价值的机会。
文物艺术品行业也许没有衣食住行等领域更加贴近生活,但在人民物质生活日益提高的今天,精神层面的提升,文化底蕴的培养逐渐得到广泛重视,赋予在文物艺术品上的传承价值让这个行业近年来呈现出蓬勃发展的趋势。其与先进技术的结合为这一领域注入了新的活力,文物艺术品图片相似度的度量不仅为用户提供智能简便的冗余信息过滤方式,更在打击出土出水被盗文物等文物监测、搜索、比对等方面带来了新的变化,在一定程度上对以往单纯的人工监测起到了辅助作用。
卷积神经网络作为近些年来计算机领域的重要成果之一,在图像处理、计算机视觉方向得到了深入研究与广泛应用,为实现人工智能带来了重大的变革。卷积神经网络以原始图像数据作为输入,通过训练的方式自主学习数据特征,丰富的训练数据帮助神经网络提取到图像的重要特征,大量的计算神经元从某种程度上实现了对大脑运算方式的模拟,学习策略和网络结构的多样化更是进一步帮助性能的提高与优化,前人对经典网络结构的探索和在庞大数据集上的预训练结果更是为后来者提供了理论经验和实现基础。在人脸识别、图像分类、目标检测等方面的学术成果与工业落地也进一步验证了卷积神经网络的强大。
因此,鉴于文物艺术品种类繁多、品目庞杂,很多艺术品具有唯一性的特点以及卷积神经网络在处理图像问题有着一定优势的综合考量,本发明以卷积神经网络为基础提出一种基于深度学习的文物艺术品领域图像相似度度量方法,实现深度学习、神经网络技术在相关领域的成功应用。
发明内容
结合上述文物艺术品领域的特点及现有文献资料中相关方法介绍较少的情况,本发明利用卷积神经网络,提供了一种基于深度学习的文物艺术品领域的图片相似度度量方法。该方法可以实现对输入文物艺术品图像特征的有效提取,并采用新方法处理图像特征,转化为相似度度量,一定程度上符合大众对图片相似与否的认知,且不同于现有文物艺术品领域相关研究,因此有一定的创新性和应用价值。
本发明提供如下技术方案:
一种基于深度学习的文物艺术品领域图像相似度度量算法,包括以下步骤:
步骤1,图片特征提取:首先需要对两张文物艺术品图片进行特征提取,使用残差网络实现对图片语义特征的提取;其次使用在2012年的ILSVRC分类数据集预训练过的resnet-18网络参数作为初始权重,在预训练的基础上进一步通过分类任务优化初始权重;所述通过分类任务优化初始权重是指从计算机视觉角度出发,将文物艺术品分为绘画、书法、瓷器、贝器、名人手迹、青铜器、石器、玉器、唐卡、文房用具、竹木牙角匏器、紫砂器、碑帖拓片、珐琅器、佛像、古典家具、古乐器、古钱币、骨器、金属器、料器、漆器共22个类别,在经由上述预训练过的resnet18中以分类任务为目标继续训练,分类准确率达到较高标准后将此时的resnet18网络参数作为特征提取网络的初始参数,最后连接512维、256维的全连接层对所提取特征进行降维与编码,完成图片特征提取,则对于每一张文物艺术品图片输入都能够得到相对应的图片特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易元数字(北京)科技集团有限公司,未经易元数字(北京)科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010319027.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种核设施事故后用吸氢材料配置工艺
- 下一篇:一种民族服饰加工用防晕染装置