[发明专利]一种基于深度卷积网络的水鸟图像识别特征融合模型系统及方法在审
申请号: | 202110086080.7 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112749760A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 周脚根;张彩云;汪洋;谢俊毅;张昀泽 | 申请(专利权)人: | 淮阴师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 张成文 |
地址: | 223001*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 网络 水鸟 图像 识别 特征 融合 模型 系统 方法 | ||
本发明公开了一种基于深度卷积网络的水鸟图像识别特征融合模型系统及方法,包括鸟类外形特征提取模块、初级卷积层模块、卷积组合层模块、底层网络特征提取模块、特征向量连接处理层、全连接特征层与分类层模块,所述鸟类外形特征提取模块与初级卷积层模块连接,所述初级卷积层模块与卷积组合层模块连接,所述底层网络特征提取模块与卷积组合层模块连接,所述底层网络特征提取模块与特征向量连接处理层连接,所述全连接特征层与特征向量连接处理层连接,所述分类层模块与全连接特征层连接。本发明涉及水鸟图像识别技术领域,具体是提供了一种基于深度卷积网络的水鸟图像识别特征融合模型系统及方法,可精准识别全球主要水鸟物种。
技术领域
本发明涉及水鸟图像识别技术领域,具体是指一种基于深度卷积网络的水鸟图像识别特征融合模型系统及方法。
背景技术
当前鸟类识别主要方法有:(1)基于鸟类分类知识;(2)基于鸟类声谱特征;(3)基于鸟类雷达反射波普特征;(4)基于机器学习/机器视觉技术;(5)基于深度卷积网络。基于鸟类分类知识的鸟类识别方法,依赖专业的鸟类分类学知识,适合专业研究人员。该方法具有识别准确性超高的优势,但是缺点是不适用于非专业的社会公众。鸟类鸣叫或鸣唱具有物种特异性,因此鸟类声谱特征被认为是识别鸟类身份的重要生物学指征。通过鸟类声音识别鸟类的研究都有报道。不过,记录鸟类声音需要专业的录音设备以及声音除燥处理,这限制了该方法应用于普通社会公众。鸟类雷达反射波探测鸟类技术已广发用于机场等总要航空领域。不过该技术总体上适用于鸟群的探测,无法探测出单一的鸟类物种类别。
基于机器学习/机器视觉技术实现鸟类图像识别的核心是:通过构建不同类型局部特征提取器,提取多维鸟类图像特征,再结合分类器实现鸟类图像分类。目前一些研究成果采用类似的方案。例如,专利CN105590116B提出了一种鸟类头部对齐的图像识别方法;专利CN105631469A提出了鸟类特征的多层稀疏编码方法;专利CN110472609A提出一个鸟类图像识别系统。这类方法的缺陷在于鸟类图像特征提取依赖先验知识以及图像特征提取的非自动学习性,这限制该类技术应用于大规模鸟类图像识别。
相对上述机器学习方法,基于鸟类图像特征的深度卷积网络方法优势在于可以自动提取高维的鸟类图像特征,实现鸟类图像特征的自动学习。一些研究依托经典深度卷积网络如Resnet、Alexnet、Googlenet已经在公开鸟类图像数据集(北美CUB200-2011数据集,包含鸟种200种)应用上取得了较高的识别精度。不过,现实世界中鸟类种类繁多以及同一分类水平上鸟种外观差异较小,这造成了直接使用经典深度卷积网络识别鸟类图像的误分率高。虽然一些研究采用细粒度图像分类技术一定程度上减少了鸟类识别的误分率。但是鸟类细粒度图像识别,依赖于对每种鸟类图像进行喙、额、颈、躯干、翅膀、脚、尾等生理部位进行精细的人工标识。这种图像预处理工作,极费人力和物力,极大限制了鸟类细粒度图像识别技术的实际应用。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供一种基于深度卷积网络的水鸟图像识别特征融合模型系统及方法,可精准识别全球主要水鸟物种。
本发明采取的技术方案如下:本发明一种基于深度卷积网络的水鸟图像识别特征融合模型系统,包括鸟类外形特征提取模块、初级卷积层模块、卷积组合层模块、底层网络特征提取模块、特征向量连接处理层、全连接特征层与分类层模块,所述鸟类外形特征提取模块与初级卷积层模块连接,所述初级卷积层模块与卷积组合层模块连接,所述底层网络特征提取模块与卷积组合层模块连接,所述底层网络特征提取模块与特征向量连接处理层连接,所述全连接特征层与特征向量连接处理层连接,所述分类层模块与全连接特征层连接。
进一步地,所述鸟类外形特征提取模块用于获取鸟类外形特征图,所述鸟类外形特征提取模块中设有MMdetection模型,所述MMdetection模型利用MMdetection网络在公共数据集COCO的鸟类数据集上进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴师范学院,未经淮阴师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086080.7/2.html,转载请声明来源钻瓜专利网。