[发明专利]基于哭声识别的遗漏孩童检测方法在审
申请号: | 201610314228.7 | 申请日: | 2016-05-13 |
公开(公告)号: | CN105976831A | 公开(公告)日: | 2016-09-28 |
发明(设计)人: | 谢剑斌;刘通;李沛秦;闫玮 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/21;G10L25/51 |
代理公司: | 湖南省国防科技工业局专利中心 43102 | 代理人: | 冯青 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种校车上的遗留孩童检测方法,采用音量初检和声音内容复核的双层检测模式,实现遗漏孩童的可靠检测。首先采用短时能量特征检测校车内是否存在音量大的声音,如果存在,则认为可能存在遗漏孩童;然后结合梅尔倒谱系数特征和支持向量机分类器进行声音内容复核,确认是否存在孩童的哭喊声和尖叫声,可靠检测校车上是否存在遗漏孩童。 | ||
搜索关键词: | 基于 哭声 识别 遗漏 孩童 检测 方法 | ||
【主权项】:
基于哭声识别的遗留孩童检测方法,其特征在于,首先采用短时能量特征检测校车内是否存在音量大的声音,如果存在,则认为可能存在遗漏孩童;然后结合梅尔倒谱系数特征和支持向量机分类器进行声音内容复核,确认是否存在孩童的哭喊声和尖叫声,检测校车上是否存在遗漏孩童;流程如下:(1)、基于短时能量的音量初检首先依据拾音器采集的音量大小来初步检测是否存在遗漏孩童,在本发明中音频数据按帧输入,采样频率为8KHz,每256个采样点为一帧,帧与帧之间不重叠,音量初检步骤为:Step1:快速傅里叶变换设
表示第t 帧第n 个采样点的音频信号,该信号是纯净声音和噪声的线性组合,为滤除噪声,需要在频域进行平滑处理,先对
进行快速傅里叶变换,得到幅度谱
,k表示频率索引;Step2:平滑功率谱计算第t帧声音信号的平滑功率谱表示为
其中,
为平滑系数,在本发明中,取
=0.5,
表示第t‑1帧的平滑功率谱,初始平滑功率谱
置为0;Step3:傅里叶反变换对
进行傅里叶反变换,得到滤波后的音频信号
;Step4:短时能量计算第t帧的短时能量
可以表示为
Step5:音量初检如果
大于阈值T,则认为可能存在遗漏孩童,进入声音内容复核阶段,否则,继续进行音量初检;在本发明中,取系统启动后前50帧短时能量的平均值作为阈值T的值;(2)、基于梅尔倒谱系数和支持向量机的声音内容复核单纯依靠音量检测遗漏孩童一般不存在漏警,但虚警率很高,为降低虚警率,在音量初检发现可疑目标之后,再采用声音识别方法分析声音内容,辨别声音中是否存在哭喊声、尖叫声,具体步骤为:Step2.1:求取对数能量谱对第t帧音频信号的幅度谱
取对数,得到对数能量谱
;Step2.2:计算梅尔倒谱系数梅尔倒谱系数(MFCC)的计算公式为:
其中,
表示第t帧的第n个梅尔倒谱系数,K表示梅尔(Mel)滤波器组的个数,在本发明中,K取24,舍弃直流成分,本发明取n=1,2,...,12;Step2.3:SVM分类将12个梅尔倒谱系数作为特征,输入支持向量机SVM分类器进行分类,如果分类结果为1,则认为存在遗漏孩童,此时启动报警装置,将警情信息发送给校车负责人和上级监管部门,提醒相关人员及时救援。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610314228.7/,转载请声明来源钻瓜专利网。