[发明专利]一种基于深度学习的鸟类识别方法在审
| 申请号: | 201810348415.6 | 申请日: | 2018-04-18 |
| 公开(公告)号: | CN108509939A | 公开(公告)日: | 2018-09-07 |
| 发明(设计)人: | 邹月娴;陆超豪 | 申请(专利权)人: | 北京大学深圳研究生院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 黄凤茹 |
| 地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 鸟类 数据集 分类模型 红树林 微调 滨海 湿地 学习 机器学习 网络训练 准确率 图像 分类 | ||
本发明公布了一种基于深度学习的鸟类识别方法,建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集上训练好的深度网络训练CUB‑200‑2011鸟类数据集,获得对鸟类数据集的微调模型;第二阶段,在自建的红树林滨海湿地数据集上微调第一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,利用分类模型实现基于深度学习的鸟类识别。本发明能够实现基于深度学习的鸟类识别,解决现有采用机器学习方法对鸟类图像进行分类和识别中速度较慢、准确率过低的问题。
技术领域
本发明属于机器学习、鸟类识别技术领域,涉及基于图像分类的鸟类识别技术,具体涉及一种基于深度学习算法的鸟类识别方法。
背景技术
近几年随着深度学习的发展,利用深度学习算法在特定数据集(如ImageNet、CUB-200-2011)上进行图像分类的准确率不断提高,图像分类已从科研领域上升到具体的实际应用,具体包括图像识别、图像检索(以图搜图)等等。在图像分类领域中,自然场景下的图像是构成数据库的主要来源,而鸟类识别是其中一个非常重要的应用场景。
鸟类识别本质是鸟类图像的分类。目前,鸟类分类的现有技术按照标记数据的多少可以分为强监督学习与弱监督学习方法。强监督学习是一种基于位置定位的模型,在训练时标注好部件的位置;虽然这种方法对部件姿态、光照的变化有很好的鲁棒性,但是额外标记数据需要大量的人力成本。弱监督学习方法通常采用常用的纹理表征方法(texturerepresentation),如传统的SIFT特征,以及近期流行的卷积神经网络ConvolutionalNeural Network,如:文献(He K,Zhang X,Ren S,et al.Deep Residual Learning forImage Recognition[J].2015:770-778.)记载的深度残差网络Deep Residual Network;弱监督学习往往是对图像一次性提取整体的特征表示,方法优势在于仅需标记类别标签,方便端到端训练、且有在ImageNet数据集上训练好的模型进行fine-tune操作;该方法的缺点在于每次处理对象仅仅是整个图像、对于区别鸟类的关键细节特征缺乏关注,因此需要更多的数据,才能更好地提取图像的特征,而鸟类图片的采集往往非常困难,特别是一些稀有鸟的照片很少,难以通过大量的数据学习特征,这导致了弱监督学习分类效果的不足。
发明内容
本发明的目的是提供一种基于深度学习的鸟类识别方法,通过建立两个阶段的训练框架,获得对于红树林滨海湿地特定鸟类的分类模型,实现基于深度学习的鸟类识别,能够解决现有采用机器学习方法对鸟类图像进行分类和识别中速度较慢、准确率过低的问题。
本发明的技术方案是:
一种基于深度学习的鸟类识别方法,首先建立两个阶段的训练框架,在第一阶段,利用在大规模公开数据集(如数据集ImageNet)上训练好的深度网络训练CUB-200-2011鸟类数据集,获得对鸟类数据集的一个微调模型;第二阶段,在我们自建的红树林滨海湿地数据集上,微调上一阶段的模型,获得对于红树林滨海湿地特定鸟类的分类模型,包括如下步骤:
A.收集红树林滨海湿地原始图片数据集,对数据集的原始图片做水平翻转处理,增加一倍的数据量,作为训练数据集:红树林鸟类数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810348415.6/2.html,转载请声明来源钻瓜专利网。





