[发明专利]一种基于卷积神经网络的海洋哺乳动物发声实时识别方法有效
申请号: | 202111456006.6 | 申请日: | 2021-12-02 |
公开(公告)号: | CN113870870B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 吕连港;段德鑫;姜莹;刘宗伟;杨春梅 | 申请(专利权)人: | 自然资源部第一海洋研究所 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/18;G10L17/04;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 沈小明 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 海洋 哺乳动物 发声 实时 识别 方法 | ||
本发明涉及一种基于一种卷积神经网络的海洋哺乳动物发声实时识别方法,属于信号处理领域,首先将一段信号进行标准化处理后通过快速傅里叶变化产生信号的时频彩色图像,随后对时频图像中的动物声信号进行标注。最后将数据送入卷积神经网络进行训练以得到一个识别模型。本发明采用卷积神经网络构建的识别模型一步式识别水下声数据中的海洋哺乳动物声信号。本发明方法能够拥有较高的召回率和准确率的同时有较快的处理速度,能够满足实时识别的需求。
技术领域
本发明属于信号处理领域,涉及一种基于卷积神经网络的海洋哺乳动物发声实时识别方法。
背景技术
海洋哺乳动物的通讯交流叫声是是一种调频信号,信号频率随时间变化形式多样,主要用于个体或群体之间的互相联络、情感表达、信息传递等。利用动物的通讯交流叫声开展声学监测是调查海洋动物的种群分布、出现情况最重要方式。因此需要开发海洋哺乳动物发声的检测和分类算法。目前大部分算法通过边缘检测、连通域识别和局部最大值等方式检测时频图中的曲线追踪动物声信号,一部分算法提取特征并使用类似于随机森林的分类算法对信号分类。这些算法的缺点在于特征提取困难,计算时间长,而不能用于实时监测系统中。
发明内容
为克服现有方法存在的问题,本发明提供了一种基于卷积神经网络的海洋哺乳动物发声实时识别方法。该方法将海洋哺乳动物叫声的检测和分类一步完成,实现了动物叫声的一步识别,不仅准确率高而且具有实时性。
本发明通过如下技术方案来实现的:
一种基于卷积神经网络的海洋哺乳动物发声实时识别方法,所述方法具体步骤如下:
(1)信号处理,将一段水下声音信号标准化处理,然后分成均等长度N段,采用快速傅里叶变化进行时频处理得到每段数据的时频图,存为三通道 (RGB)彩色时频图像;
(2)信号标注,检查每一张三通道彩色时频图像,使用矩形框将出现的海洋哺乳动物叫声信号的轮廓包围住,并标注物种类别,通过程序自动获得矩形框的中心坐标及宽高,将这部分标注信息写入标注文件;
(3)识别模型的设计,识别模型使用卷积神经网络,卷积神经网络的输入为三通道彩色时频图像矩阵,卷积神经网络的输出为一个识别矩阵;
(4)识别模型训练,将三通道彩色时频图像与标注文件输入卷积神经网络进行训练,根据损失函数计算网络输出与标注信号的损失,在训练过程中不断优化此损失,在达到预定轮次后结束训练,训练完成后得到识别模型;
卷积神经网络输出与真实标注信号的损失由函数计算:
其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于自然资源部第一海洋研究所,未经自然资源部第一海洋研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111456006.6/2.html,转载请声明来源钻瓜专利网。