[发明专利]基于深度学习与迁移学习的图像识别方法在审
申请号: | 201710191824.5 | 申请日: | 2017-03-28 |
公开(公告)号: | CN106991439A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 吕艳洁;戴川 | 申请(专利权)人: | 南京天数信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京钟山专利代理有限公司32252 | 代理人: | 戴朝荣 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 迁移 图像 识别 方法 | ||
技术领域
本发明属于图像识别技术领域,具体地涉及一种基于深度学习与迁移学习的图像识别方法。
背景技术
随着大数据时代的到来,深度学习技术被越来越多地运用到图像识别的应用中。深度学习是一种源于人工神经网络的强大技术。而人工神经网络则受自然界生物的神经网络启发,通过构建多层次的神经元,加上大量数据的反复训练,进而达到类似人类的准确识别图像的能力。
在图像识别领域,深度学习技术已被无数事实证明是目前最有效的手段。理论上说,参数越多的模型复杂度越高,能力也越大,但也意味着训练效率相对更低,也更易与陷入过拟合。神经网络层数越多,每轮训练向前传递的误差更为发散,同时,计算误差所需时间复杂度更是随层数的增加呈指数型增大。
在传统的机器学习的框架下,学习的任务就是在给定充分训练数据的基础上来学习一个分类模型;然后利用这个学习到的模型来对测试样本进行分类与预测。然而,我们看到机器学习算法在当前的图像识别研究中存在着一个关键的问题:一些新出现的领域中的大量有标记的训练图片数据非常难得到。图形识别在医疗领域的发展非常快速,传统的机器学习需要对每种疾病图像都标定大量训练数据,这将会耗费大量的人力与物力。而没有大量的标注数据,会使得很多与学习相关研究与应用无法开展。这往往需要我们去重新标注大量的训练数据以满足我们训练的需要,但标注新数据是非常昂贵的,需要大量的人力与物力。迁移学习可以从现有的数据中迁移知识,用来帮助将来的学习。
目前,对于图像识别类产品,人们更多关注的是计算机对人脸、车牌、运动目标等生活图像的识别。而对于医学领域的图像识别,由于缺乏专业图像素材以及医学专家的支持,许多图像识别任务存在训练时间过长、样本数量不足以支撑卷积神经网络的训练、模型在新样本上表现不佳等诸多问题。
发明内容
本发明的目的在于针对现有技术的缺陷,提供一种能够提高图像识别准确度的基于深度学习与迁移学习的图像识别方法。
本发明的技术方案如下:一种基于深度学习与迁移学习的图像识别方法包括如下步骤:一、准备阶段:读取预训练模型,并读取图片目录,划分训练集、验证集以及测试集;二、训练阶段:构造全连接神经网络分类器,并将图片集作为所述预训练模型的输入,使用与所述预训练模型的输出更新所述全连接神经网络分类器;三、存储阶段:存储模型结果。
优选地,在步骤一中,准备阶段具体包括如下步骤:检查与训练模型是否存在;如果否,则下载所述预训练模型;如果是,则读取读取所述预训练模型,并读取图片目录,划分训练集、验证集以及测试集。
优选地,在步骤二中,所述训练阶段具体包括如下步骤:在读取所述预训练模型后,构造所述全连接神经网络分类器;开始新的训练迭代;将图片集作为所述预训练模型的输入,使用与所述预训练模型的输出更新所述全连接神经网络分类器;检查是否达到规定迭代次数,如果否,则跳转到所述开始新的训练迭代步骤;如果是,则执行步骤三。
优选地,在训练阶段的训练迭代中,具体包括如下步骤:根据标签随机读取若干图片;随机对图像进行翻转和平移;使用所述预训练模型提取变形后图像的特征值;将所述特征值作为所述全连接神经网络分类器的输入,并更新神经网络参数;判断是否达到规定的采样次数,如果是,则结束;如果否,则返回根据标签随机读取若干图片步骤。
优选地,在步骤三的存储阶段之后还包括预测阶段,所述预测阶段包括如下步骤:读取所述预训练模型的结果模型;接收新图片作为所述结果模型的输入;根据所述结果模型的输出,得到阳性概率;判断是否仍有图片需要预测,如果是,则跳转到接收新图片作为所述结果模型的输入的步骤;如果否,则结束。
本发明提供的技术方案具有如下有益效果:
所述基于深度学习与迁移学习的图像识别方法结合深度学习与迁移学习的应用,从而在极有限的训练时间、训练样本数量的基础上,为使用者提供相对准确的膀胱癌诊断结果;
而且,在训练阶段,训练数据集需求量极大缩小,深度神经网络通常需要上万张图像的用意训练,本模型仅仅使用约500张原始图像用以训练;
此外,在训练阶段,训练时间大幅缩短,300秒以内即可完成相应的训练,并且预测模型在新样本上的表现良好,预测准确率达到了85%以上。
附图说明
图1是本发明实施例提供的基于深度学习与迁移学习的图像识别方法的流程示意图;
图2是图1所示基于深度学习与迁移学习的图像识别方法的训练阶段中训练迭代的流程示意图;
图3是图1所示基于深度学习与迁移学习的图像识别方法的预测阶段的流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京天数信息科技有限公司,未经南京天数信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710191824.5/2.html,转载请声明来源钻瓜专利网。