[发明专利]声纹识别方法及声纹识别系统在审
| 申请号: | 202110084066.3 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112735436A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 姚永波;赵刚;张海波;崔力民;杨淼;王晓波;童欣宇;焦小龙;李欢;巴燕·塔斯恒;马国强;刘雅婷;侯建明;杨建 | 申请(专利权)人: | 国网新疆电力有限公司信息通信公司;国家电网有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L25/30;G10L25/45;G06F17/14 |
| 代理公司: | 乌鲁木齐合纵专利商标事务所 65105 | 代理人: | 周星莹;李慧琴 |
| 地址: | 830001 新疆维吾尔*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声纹 识别 方法 系统 | ||
1.一种声纹识别方法,其特征在于包括步骤1,采集并量化电力调度时产生的语音信号产生的语音数据,将得到的语音数据进行预处理,以将语音数据处理为若干个平滑过渡并去除静音部分的语音片段;步骤2,选取语音片段下的多个声音灰度图像训练卷积神经网络,建立声纹识别模型;步骤3,将多个声音灰度图像作为卷积神经网络的输入参数;步骤4,将与多个声音灰度图像一一对应的工作状态信息作为卷积神经网络的输出参数;步骤5,将待测声音灰度图像输入声纹识别模型,获取与待测声音灰度图像相对应的工作状态信息。
2.根据权利要求1所述的声纹识别方法,其特征在于步骤1中,将得到的若干个语音片段,针对每一个语音片段分别进行傅里叶变换,根据傅里叶变换结果分别处理生成每个语音片段各自对应的灰度图像形式的语谱图,语谱图中宽度对应语音信号持续的时间,高度对应语音信号的频率。
3.根据权利要求1或2所述的声纹识别方法,其特征在于步骤2具体为:随机选取多种电力调度工作状态时的多个声音灰度图像,将多个声音灰度图像划分为训练样本集和测试样本集,多种工作状态对应设置为多个与多个声音灰度图像一一对应的工作状态信息。
4.根据权利要求3所述的声纹识别方法,其特征在于将训练样本集中的多个声音灰度图像作为卷积神经网络的输入,将多个工作状态信息分别作为卷积神经网络的输出,对卷积神经网络进行训练,将测试样本集中的多个声音灰度图像输入训练后的卷积神经网络,记录声纹识别模型输出的多个与多个声音灰度图像一一对应的测试工作状态信息,并根据多个测试工作状态信息计算训练后的卷积神经网络的识别率。
5.根据权利要求4所述的声纹识别方法,其特征在于若卷积神经网络的识别率的变化率小于预设值,依据训练后的卷积神经网络建立声纹识别模型。
6.根据权利要求1或2或4或5所述的声纹识别方法,其特征在于卷积神经网络和长短期记忆网络串联构建神经网络,将得到的每个语音片段对应的语谱图分别输入神经网络,神经网络中,首先由积神经网络对每个语谱图进行处理。
7.根据权利要求3所述的声纹识别方法,其特征在于卷积神经网络和长短期记忆网络串联构建神经网络,将得到的每个语音片段对应的语谱图分别输入神经网络,神经网络中,首先由积神经网络对每个语谱图进行处理。
8.一种实施权利要求1至7任意一项所述的声纹识别方法的声纹识别系统,其特征在于包括采集模块、模型建立模块、输入模块、输出模块和结果模块;
采集模块,用于采集并量化电力调度时产生的语音信号产生的语音数据,将得到的语音数据进行预处理,以将语音数据处理为若干个平滑过渡并去除静音部分的语音片段;
模型建立模块,用于选取语音片段下的多个声音灰度图像训练卷积神经网络,建立声纹识别模型;
输入模块,用于将多个声音灰度图像作为卷积神经网络的输入参数;
输出模块,用于将与多个声音灰度图像一一对应的工作状态信息作为卷积神经网络的输出参数;
结果模块,用于将待测声音灰度图像输入声纹识别模型,获取与待测声音灰度图像相对应的工作状态信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司信息通信公司;国家电网有限公司,未经国网新疆电力有限公司信息通信公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084066.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:卷拉门式智能通信屏柜
- 下一篇:废弃植物纤维生产复合饲草的方法





