[发明专利]一种基于声音的大熊猫属性识别方法及系统有效
| 申请号: | 202210791585.8 | 申请日: | 2022-07-07 |
| 公开(公告)号: | CN114863939B | 公开(公告)日: | 2022-09-13 |
| 发明(设计)人: | 赵启军;张艳秋;陈鹏;侯蓉;刘鹏;唐金龙;何梦楠 | 申请(专利权)人: | 四川大学;成都大熊猫繁育研究基地 |
| 主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/02;G10L17/04;G10L17/18;G10L21/0232;G10L21/0264;G10L25/21;G10L25/24;G10L25/63 |
| 代理公司: | 成都四合天行知识产权代理有限公司 51274 | 代理人: | 张超 |
| 地址: | 610000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 声音 大熊猫 属性 识别 方法 系统 | ||
1.一种基于声音的大熊猫属性识别方法,其特征在于,包括:
获取大熊猫的声音数据作为第一声音数据;
预处理所述第一声音数据,并对预处理后的所述第一声音数据标注年龄信息和性别信息生成第二声音数据;
从所述第二声音数据中获取梅尔倒谱系数和感知线性预测系数,并将所述感知线性预测系数、所述梅尔倒谱系数和翻转后的所述梅尔倒谱系数组合形成融合特征;
以分布一致作为约束条件对所述融合特征进行数据增强形成第一样本数据;
对所述第一样本数据进行卷积神经网络训练,形成大熊猫属性识别模型;
将目标声音数据输入根据所述大熊猫属性识别模型,生成对应所述目标声音数据的年龄信息和性别信息;
对预处理后的所述第一声音数据标注年龄信息和性别信息生成第二声音数据包括:
根据所述年龄信息和所述性别信息对所述第一声音数据进行预分析生成多组预分析特征;所述预分析特征为不同年龄信息和/或性别信息之间的区别符合预期的声音数据特征;
根据每组预分析特征构建对应的核函数和聚类半径形成多组聚类参数;
以每组聚类参数对所述第一声音数据进行聚类分析形成多组聚类结果;
将所述聚类结果比对于所述年龄信息和所述性别信息的分类情况,并将与所述分类情况最接近的至少一组聚类结果作为选定聚类结果;
根据所述选定聚类结果对应的所述预分析特征对所述第一声音数据进行标注。
2.根据权利要求1所述的一种基于声音的大熊猫属性识别方法,其特征在于,以分布一致作为约束条件对所述融合特征进行数据增强形成样本数据包括:
对所述融合特征依次进行频率掩膜数据增强和时间掩膜数据增强形成第二样本数据;
根据贝塔分布获取对应所述融合特征和所述第二样本数据的加权参数;
根据所述加权参数将所述融合特征和所述第二样本数据进行加权融合形成所述第一样本数据。
3.根据权利要求2所述的一种基于声音的大熊猫属性识别方法,其特征在于,对所述融合特征依次进行频率掩膜数据增强和时间掩膜数据增强形成第二样本数据包括:
在梅尔频谱范围内将预设掩膜添加到所述梅尔频谱的频率轴完成频率掩膜;
在梅尔频谱范围内将所述预设掩膜添加到所述梅尔频谱的时间轴完成频率掩膜;所述预设掩膜的数量和宽度根据所述梅尔频谱确定。
4.根据权利要求1所述的一种基于声音的大熊猫属性识别方法,其特征在于,预处理所述第一声音数据包括:
从所述第一声音数据中剔除碰撞噪声生成纯净声音数据;
将所述纯净声音数据按照所述年龄信息分为成年大熊猫声音数据和幼年大熊猫声音数据;
从所述成年大熊猫声音数据中提取背景声音数据,并将所述背景声音数据整合进所述幼年大熊猫声音数据;
将所述成年大熊猫声音数据和整合了所述背景声音数据的所述幼年大熊猫数据作为预处理完成的第一声音数据。
5.根据权利要求4所述的一种基于声音的大熊猫属性识别方法,其特征在于,从所述第二声音数据中获取梅尔倒谱系数和感知线性预测系数包括:
计算所述第二声音数据的功率谱估计数据,并将重叠的临界带滤波器响应整合进所述功率谱估计数据形成功率谱整合数据;
将所述功率谱整合数据对频率上的对称频域进行卷积允许低频掩盖高频并平滑频谱后预加重频谱,并压缩频谱振幅形成预处理功率谱数据;
将所述预处理功率谱数据进行离散傅里叶反变换得到自相关系数,进行谱平滑,求解自回归方程,将自回归系数转换为倒谱变量,得到所述感知线性预测系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;成都大熊猫繁育研究基地,未经四川大学;成都大熊猫繁育研究基地许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210791585.8/1.html,转载请声明来源钻瓜专利网。





