[发明专利]一种基于声音识别的教学考勤方法在审
申请号: | 201810608125.0 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108806694A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 高艳艳;杨平平;于海波 | 申请(专利权)人: | 高艳艳;杨平平;于海波 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18;G10L25/54;G10L25/30;G10L25/24;G01S5/18;G07C1/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 062450 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 考勤 学生 声音识别 有效地 神经网络结构 全局最优解 变异算子 大小判断 课堂纪律 空间定位 神经网络 声纹识别 声学模型 声源位置 语音识别 基函数 拾音器 音量 处理器 聚类 声纹 算法 教学 匹配 收敛 遗传 语音 分类 监测 优化 讲话 | ||
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:
步骤一、采集老师点名的声音信号,对该原始信号采样量化,把原始语音信号转化成数字信号,对转换成数字信号后的语音信号进行预加重、取音框、加窗、去噪的预处理;
步骤二、对预加重后每帧序列进行离散FFT变换,取模的平方得到离散功率谱S(n),计算S(n)通过M个带通滤波器后得到的功率值Pm,计算Pm的自然对数,得到Lm,计算其离散余弦变换,得到Dm,舍去直流分量,得到MFCC参数,在数据库内查找与该MFCC参数信息匹配的相对应姓名的学生个人信息;
步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,通过遗传算法获得基函数的中心以及隐含层单元的高斯函数的宽度,设计编码、交叉和变异算子,构建三层遗传优化RBF神经网络模型;
步骤四、处理器利用语音识别中的构建遗传优化RBF神经网络模型分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNN i-vector进行答到学生语音的声纹识别;
步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;
步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;
步骤七、教学过程中,拾音器实时获取教室内的声音,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。
2.如权利要求1所述基于声音识别的教学考勤方法,其特征在于,步骤七所述判断学生是否在私自讲话的具体方法为:
步骤一、若识别出学生的声音,则判断当前时间老师是否在发声,若老师在发声,则判断学生在私自讲话,记录在考勤中;
步骤二、若老师未发声,读取前n秒钟时间点时老师的声源的位置,根据学生声源的朝向,判断学生声音是否是否朝向老师,若不是朝向老师,则判定学生在课程上私自讲话,记录在考勤系统中;
步骤三、若学生声源朝向老师,则根据学生与老师位置的距离,判断声源音量大小是否在阈值内,若是,则判定学生在回答老师的问题,若不是,则判定学生在私自讲话,记录在考勤系统中。
3.如权利要求1所述基于声音识别的教学考勤方法,其特征在于,步骤四所述语音的声纹识别方法如下:
步骤一、把原始语音信号转化成数字信号,使用一阶高通滤波器去除语音信号中多余的噪声,消除直流漂移,通过加重处理保留对特征参数有用的池音信号;
步骤二、语音信号的处理,取256个点作为一个32ms音框,对每个音框乘以汉明窗,消除音框两端的不连续性,采用低通滤波器去除噪声;
步骤三、采用基于似然概率的的加权投票法,根据不同语音帧与概率模型之间的似然概率取值,对每一帧语音进行加权;
步骤四、把不同地区及不同性别的声音片段映射到多维的特征空间,表征说话人个性特征的向量序列;
步骤五、采用RBM对DNN网络参数初始化,采用带有标签的训练数据对DNN网络进行监督的参数更新,在DNN训练中采用误差反向传递算法巧进行参数训练;
步骤六、在基于GMM的特征端因子分析中采用DNN替代GMM模型划分音素特征子空间,实现在每个子空间内对特征进行降维;
步骤七、对每个子空间内降维后的特征端因子与表征说话人个性特征的向量序列分别进行匹配。
4.如权利要求3所述基于声音识别的教学考勤方法,其特征在于,声纹识别方法还包括构建不同地区及不同性别的语音信息数据库,将该语音数据库中的语音数据信息添加上地理区域信息标签和性别信息标签。
5.如权利要求3所述基于声音识别的教学考勤方法,其特征在于,声纹识别方法还包括对每个子空间内降维后的特征端因子与带有地理区域信息标签和性别信息标签的表征说话人个性特征的向量序列分别进行匹配;将匹配后的特征端因子添加地理区域信息标签和性别信息标签,将DNN网络中该特征端因子参数更新,以性别信息标签的数据信息为基准进行声纹信息的匹配,以地理区域信息标签的数据信息为基准对匹配信息予以确认。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高艳艳;杨平平;于海波,未经高艳艳;杨平平;于海波许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810608125.0/1.html,转载请声明来源钻瓜专利网。