[发明专利]一种声音识别方法、装置、电子设备及存储介质在审
申请号: | 202111390367.5 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114049899A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 郭颖;高家军;张旭;陈艳;范东璞;于新文;邓广;欧阳萱 | 申请(专利权)人: | 中国林业科学研究院资源信息研究所 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/14;G10L17/18;G10L17/26 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 彭星 |
地址: | 100091*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 识别 方法 装置 电子设备 存储 介质 | ||
本申请涉及声音识别技术领域,具体提供一种声音识别方法、装置、电子设备及存储介质,对获取的长臂猿录音数据进行预处理、提取Mel谱特征,通过将Mel谱特征训练好的长臂猿声音分类模型得到待分类长臂猿录音数据中的长臂猿音频片段,并对长臂猿音频片段进行拼接裁剪得到完整的长臂猿音频,进而记录长臂猿在目标区域的鸣叫时间,实现对长臂猿的高效监测。由于采用的长臂猿声音分类模型更为轻量化,能够快速识别出长臂猿录音数据中的长臂猿音频片段,实现对长臂猿的实时监测。
技术领域
本申请涉及声音识别技术领域,具体而言,涉及一种声音识别方法、装置、电子设备及存储介质。
背景技术
海南长臂猿是海南热带雨林国家公园的旗舰物种之一,属于国家1级保护物种,已被世界自然保护联盟红皮书列为“全球最濒危灵长动物”之一,具有重要研究意义与保护价值,实现对海南长臂猿高效监测是对其保护的前提,也是加强保护的必要手段。
由于长臂猿科动物鸣声独特,因此目前对于长臂猿的监测方法主要以声音监测为主,该方法的关键性问题是如何快速准确地对长臂猿声音进行识别。目前关于长臂猿声音识别方法多由专业人员声音解译为主,通过专业人员跟踪录音,或是通过布置的设备采集声音数据再人工解译的方式来识别。专业人员跟踪录音的方法虽然可以实现精细的数据获取,但无法确保数据的持续性和完整度;布置设备采集声音数据的方法虽然可以弥补数据获取持续性和完整度方面的不足,但定期取回的数据仍需要花费大量的人力物力进行筛选识别。总体而言,受限于两种方法的局限性,实现对海南长臂猿的高效监测仍是一个亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种声音识别方法、装置、电子设备及存储介质,能够实现对长臂猿的高效监测。
本申请实施例提供的一种声音识别方法,包括以下步骤:
获取长臂猿录音数据;
对所述长臂猿录音数据进行预处理,得到待分类长臂猿录音数据;
提取所述待分类长臂猿录音数据的Mel谱特征;
基于训练好的长臂猿声音分类模型,根据所述Mel谱特征对所述待分类长臂猿录音数据进行分类,得到所述待分类长臂猿录音数据中的长臂猿音频片段。
在一些实施例中,所述获取长臂猿录音数据,包括以下步骤:
在长臂猿群中通过录音设备实时采集长臂猿录音数据,所述长臂猿录音数据包括含有长臂猿音频的片段和不含有长臂猿音频的片段。
在一些实施例中,所述对所述长臂猿录音数据进行预处理,得到待分类长臂猿录音数据,包括以下步骤:
对所述长臂猿录音数据进行采样量化;
对采样量化后的长臂猿录音数据进行预加重;
对预加重后的长臂猿录音数据进行分帧;
对分帧后的长臂猿录音数据进行加窗,得到待分类长臂猿录音数据。
在一些实施例中,所述提取所述待分类长臂猿录音数据的Mel谱特征,包括以下步骤:
对所述待分类长臂猿录音数据进行快速傅里叶变换得到信号频谱;
对所述信号频谱进行Mel频率转换得到Mel频率;
将所述Mel频率进行Mel滤波得到Mel谱特征。
在一些实施例中,所述基于训练好的长臂猿声音分类模型,根据所述Mel谱特征对所述待分类长臂猿录音数据进行分类,得到所述待分类长臂猿录音数据中的长臂猿音频,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国林业科学研究院资源信息研究所,未经中国林业科学研究院资源信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111390367.5/2.html,转载请声明来源钻瓜专利网。