[发明专利]一种基于声音识别的教学考勤方法在审
申请号: | 201810608125.0 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108806694A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 高艳艳;杨平平;于海波 | 申请(专利权)人: | 高艳艳;杨平平;于海波 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18;G10L25/54;G10L25/30;G10L25/24;G01S5/18;G07C1/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 062450 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于声音识别的教学考勤方法,处理器利用语音识别中的声学模型深度神经网络对学生的声音信号进行分类,提取出说话人信息并用于提取DNN i‑vector进行答到学生语音的声纹识别,将识别出来的答到学生的声纹进行答到匹配,采用五个拾音器进行答到学生声源的空间定位,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话,达到了考勤与课堂纪律监测的目的,采用遗传优化RBF神经网络结构,有效地克服了传统RBF网络难以确定基函数的中心和宽度的缺点,同时根据聚类问题的实际情况设计编码、交叉和变异算子,使得算法更快、更有效地收敛于全局最优解。 | ||
搜索关键词: | 声源 考勤 学生 声音识别 有效地 神经网络结构 全局最优解 变异算子 大小判断 课堂纪律 空间定位 神经网络 声纹识别 声学模型 声源位置 语音识别 基函数 拾音器 音量 处理器 聚类 声纹 算法 教学 匹配 收敛 遗传 语音 分类 监测 优化 讲话 | ||
【主权项】:
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:步骤一、采集老师点名的声音信号,对该原始信号采样量化,把原始语音信号转化成数字信号,对转换成数字信号后的语音信号进行预加重、取音框、加窗、去噪的预处理;步骤二、对预加重后每帧序列进行离散FFT变换,取模的平方得到离散功率谱S(n),计算S(n)通过M个带通滤波器后得到的功率值Pm,计算Pm的自然对数,得到Lm,计算其离散余弦变换,得到Dm,舍去直流分量,得到MFCC参数,在数据库内查找与该MFCC参数信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,通过遗传算法获得基函数的中心以及隐含层单元的高斯函数的宽度,设计编码、交叉和变异算子,构建三层遗传优化RBF神经网络模型;步骤四、处理器利用语音识别中的构建遗传优化RBF神经网络模型分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNN i‑vector进行答到学生语音的声纹识别;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;步骤七、教学过程中,拾音器实时获取教室内的声音,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高艳艳;杨平平;于海波,未经高艳艳;杨平平;于海波许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810608125.0/,转载请声明来源钻瓜专利网。