[发明专利]一种婴儿声音检测方法、装置和存储介质在审
| 申请号: | 202211391630.7 | 申请日: | 2022-11-08 |
| 公开(公告)号: | CN115662476A | 公开(公告)日: | 2023-01-31 |
| 发明(设计)人: | 谭明奎;胡玮文;游增;陈耀佛;连梓豪;杜卿 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/24;G10L25/27;G06F18/2411 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
| 地址: | 510641 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 婴儿 声音 检测 方法 装置 存储 介质 | ||
本发明公开了一种婴儿声音检测方法、装置和存储介质,其中方法包括以下步骤:获取音频片段;根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。本发明通过考虑当前计算资源的负载情况,对音频数据进行缓冲处理,能够提高检测的精准度。本发明可广泛应用于婴儿声音分析技术领域。
技术领域
本发明涉及婴儿声音分析技术领域,尤其涉及一种婴儿声音检测方法、装置和存储介质。
背景技术
现今婴儿看护是年轻父母的一个重要关注问题,而婴儿尚未学会说话,通常只能通过啼哭表达不适感和需求,当婴儿被单独放置在婴儿床、婴儿车休息或玩耍时,看护人不在身边,无法对婴儿哭声做出及时发现和检测,可能会导致无法意料的后果。近年来,智能家居已逐渐走入人们的生活,给大家的日常起居带来了方便。其中,各种带有婴儿声音检测的装置能够识别婴儿的哭声,并通过各种方法通知其监护人,以便于监护人能更快地发现宝宝的需求,保护宝宝健康茁壮成长。这些装置通常可以集成在婴儿床、婴儿车等产品或者安置在婴儿房中,及时检测婴儿啼哭并提醒看护人。
然而,现有的婴儿声音检测方法都存在一些不足:在检测方式上,基于简单的模拟电路或仅基于梅尔频谱的检测算法通常准确率不够高,存在漏检或误检的问题;现有基于深度学习的方法在训练和部署上较为复杂,计算成本要求较高,难以在边端实现部署和实时监测。在检测算法运行的设备上,基于云端识别的方案依赖稳定网络,可靠性较低;本地识别方案则受限于部署设备的运算能力,在与其他智能算法共享计算资源时,可能会因为资源争用导致实时性不足,导致提醒不及时,甚至准确度下降。因此需要设计一种准确率更高,且能自动适应所能使用的计算资源,在物联网万物互联的趋势下能灵活调度的实时婴儿声音检测方法。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种婴儿声音检测方法、装置和存储介质。
本发明所采用的技术方案是:
一种婴儿声音检测方法,包括以下步骤:
获取音频片段;
根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段;
根据所述缓存音频片段进行啼哭检测,并将检测结果保存至检测队列;
根据检测队列中的多次检测结果进行投票处理,获得最终的检测结果。
进一步地,所述获取音频片段,包括:
采用驱动程序,从麦克风设备中读取音频片段;
其中,所述驱动程序部署在Linux操作系统中。
进一步地,所述采用驱动程序,从麦克风设备中读取音频片段,包括:
调用Linux操作系统的ALSA驱动接口,初始化麦克风设备;
从ALSA中获取声卡硬件的时间戳,以及读取音频波形数据;
通过消息队列将音频波形数据和时间戳、采样率进行打包,获得音频片段。
进一步地,所述根据当前计算资源的负载情况,对所述音频片段进行缓冲处理,获得缓存音频片段,包括:
从消息队列中读取音频消息;
将读取到的音频消息的时间戳和当前时间进行比对,若时间相差超过预设阈值,判定目前检测延迟过高,丢弃所有时间戳在n秒前的未处理的数据包;其中,n为预设的检测窗口长度;
根据时间戳判断当前音频片段是否和之前缓冲的内容连续,若不连续,清空缓冲和检测队列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391630.7/2.html,转载请声明来源钻瓜专利网。





