[发明专利]一种婴儿声音检测方法、装置和存储介质在审
| 申请号: | 202211391630.7 | 申请日: | 2022-11-08 |
| 公开(公告)号: | CN115662476A | 公开(公告)日: | 2023-01-31 |
| 发明(设计)人: | 谭明奎;胡玮文;游增;陈耀佛;连梓豪;杜卿 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/24;G10L25/27;G06F18/2411 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
| 地址: | 510641 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 婴儿 声音 检测 方法 装置 存储 介质 | ||
1.一种婴儿声音检测方法,其特征在于,包括以下步骤:
获取音频片段;
根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;
根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;
根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。
2.根据权利要求1所述的一种婴儿声音检测方法,其特征在于,所述获取音频片段,包括:
采用驱动程序,从麦克风设备中读取音频片段;
其中,所述驱动程序部署在Linux操作系统中。
3.根据权利要求2所述的一种婴儿声音检测方法,其特征在于,所述采用驱动程序,从麦克风设备中读取音频片段,包括:
调用Linux操作系统的ALSA驱动接口,初始化麦克风设备;
从ALSA中获取声卡硬件的时间戳,以及读取音频波形数据;
通过消息队列将音频波形数据和时间戳、采样率进行打包,获得音频片段。
4.根据权利要求3所述的一种婴儿声音检测方法,其特征在于,所述根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段,包括:
从消息队列中读取音频消息;
将读取到的音频消息的时间戳和当前时间进行比对,若时间相差超过预设阈值,判定目前检测延迟过高,丢弃所有时间戳在n秒前的未处理的数据包;其中,n为预设的检测窗口长度;
根据时间戳判断当前音频片段是否和之前缓冲的内容连续,若不连续,清空缓冲和检测队列;
将当前音频消息中的音频波形数据加入缓冲;
当缓冲中的音频波形数据达到或超过n秒后,将缓冲中的音频波形数据拼接,作为缓存音频片段。
5.根据权利要求1所述的一种婴儿声音检测方法,其特征在于,所述根据所述缓存音频片段进行啼哭检测,包括:
对所述缓存音频片段进行特征提取,根据提取的特征和预设的支持向量机进行分类识别,
获得识别结果;
所述支持向量机通过以下方式获得;
获取数据集,对数据集进行重采样,并进行特征提取;其中,提取的特征包括梅尔频率倒谱系数、频谱滚降点、频谱质心、过零率、频谱频宽、均方根能量;
根据提取的特征拟合获得支持向量机。
6.根据权利要求5所述的一种婴儿声音检测方法,其特征在于,所述频谱质心定义如下:
C=∑kSkfk/∑kSk
频谱频宽为二阶频谱频宽,定义如下:
其中,Sk表示第k个窗口的频谱,fk表示频谱第k个数据点对应的频率。
7.根据权利要求1所述的一种婴儿声音检测方法,其特征在于,所述根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果,包括:
当检测到检测队列中存储的检测结果达到或超过m次,且最近m次中超过半数的检测结果相同,将该检测结果作为最终的检测结果;其中,m为预设的滤波窗口大小。
8.根据权利要求7所述的一种婴儿声音检测方法,其特征在于,所述将该检测结果作为最终的检测结果,包括:
若检测结果为婴儿正在啼哭,触发预设的报警信息。
9.一种婴儿声音检测装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-8任一项所述方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-8任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391630.7/1.html,转载请声明来源钻瓜专利网。





