[发明专利]声纹识别方法及声纹识别系统在审
| 申请号: | 202110084066.3 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112735436A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 姚永波;赵刚;张海波;崔力民;杨淼;王晓波;童欣宇;焦小龙;李欢;巴燕·塔斯恒;马国强;刘雅婷;侯建明;杨建 | 申请(专利权)人: | 国网新疆电力有限公司信息通信公司;国家电网有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L25/30;G10L25/45;G06F17/14 |
| 代理公司: | 乌鲁木齐合纵专利商标事务所 65105 | 代理人: | 周星莹;李慧琴 |
| 地址: | 830001 新疆维吾尔*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声纹 识别 方法 系统 | ||
本发明涉及语音检测方法技术领域,是一种声纹识别方法及声纹识别系统,后者包括采集模块、模型建立模块、输入模块、输出模块和结果模块。本发明相比于现有技术,声音灰度图像能够放大调度员声音信号的时频特性,能够提高待测声音的辨识度;当将待识别调度员的待测声音灰度图像作为声纹识别模型的输入参数,声纹识别模型能够准确识别所述调度员的工作状态;能够有效提取调度员声音信号时频特征,进而提高了调度员工作状态识别的准确性。
技术领域
本发明涉及语音检测方法技术领域,是一种声纹识别方法及声纹识别系统。
背景技术
调度语音作为调度员下达口令最直接的方式,也是调度信息传递最常用的载体,在人工智能水平越来越高的今天,更加需要智能化的调度语音处理平台,识别、分析和诊断各类调度语音信息,辅助调度员做出最及时的反应、最精确的判断和最高效的分析。
时频分析法是声信号处理领域的一种常用手段。但运行中的调度员的声信号不可避免地会受到电流、噪声干扰等的影响,使得不同时间监测到的声波信号亦会随之改变且呈现宽带非平稳特征,其时频特性表现出一定复杂性,难以直接进行分析以区分调度员的不同工作状态。如何提高调度员工作状态识别的准确性是亟待解决的问题。
发明内容
本发明提供了一种声纹识别方法及声纹识别系统,克服了上述现有技术之不足,其能有效提取调度员声音信号时频特征,进而提高调度员工作状态识别的准确性。
本发明的技术方案之一是通过以下措施来实现的:一种声纹识别方法,包括步骤1,采集并量化电力调度时产生的语音信号产生的语音数据,将得到的语音数据进行预处理,以将语音数据处理为若干个平滑过渡并去除静音部分的语音片段;步骤2,选取语音片段下的多个声音灰度图像训练卷积神经网络,建立声纹识别模型;步骤3,将多个声音灰度图像作为卷积神经网络的输入参数;步骤4,将与多个声音灰度图像一一对应的工作状态信息作为卷积神经网络的输出参数;步骤5,将待测声音灰度图像输入声纹识别模型,获取与待测声音灰度图像相对应的工作状态信息。
下面是对上述发明技术方案之一的进一步优化或/和改进:
上述步骤1中,将得到的若干个语音片段,针对每一个语音片段分别进行傅里叶变换,根据傅里叶变换结果分别处理生成每个语音片段各自对应的灰度图像形式的语谱图,语谱图中宽度对应语音信号持续的时间,高度对应语音信号的频率。
上述步骤2具体为:随机选取多种电力调度工作状态时的多个声音灰度图像,将多个声音灰度图像划分为训练样本集和测试样本集,多种工作状态对应设置为多个与多个声音灰度图像一一对应的工作状态信息。
上述将训练样本集中的多个声音灰度图像作为卷积神经网络的输入,将多个工作状态信息分别作为卷积神经网络的输出,对卷积神经网络进行训练,将测试样本集中的多个声音灰度图像输入训练后的卷积神经网络,记录声纹识别模型输出的多个与多个声音灰度图像一一对应的测试工作状态信息,并根据多个测试工作状态信息计算训练后的卷积神经网络的识别率。
上述若卷积神经网络的识别率的变化率小于预设值,依据训练后的卷积神经网络建立声纹识别模型。
上述卷积神经网络(CNN网络)和长短期记忆网络(LSTM网络)串联构建神经网络,将得到的每个语音片段对应的语谱图分别输入神经网络,神经网络中,首先由积神经网络对每个语谱图进行处理。
本发明的技术方案之二是通过以下措施来实现的:一种声纹识别系统,包括采集模块、模型建立模块、输入模块、输出模块和结果模块;
采集模块,用于采集并量化电力调度时产生的语音信号产生的语音数据,将得到的语音数据进行预处理,以将语音数据处理为若干个平滑过渡并去除静音部分的语音片段;
模型建立模块,用于选取语音片段下的多个声音灰度图像训练卷积神经网络,建立声纹识别模型;
输入模块,用于将多个声音灰度图像作为卷积神经网络的输入参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司信息通信公司;国家电网有限公司,未经国网新疆电力有限公司信息通信公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084066.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卷拉门式智能通信屏柜
- 下一篇:废弃植物纤维生产复合饲草的方法





