[发明专利]一种人声识别系统在审
申请号: | 202110367218.0 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113077794A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 程杰 | 申请(专利权)人: | 南京新知艺测科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/18 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 龙涛 |
地址: | 212000 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人声 识别 系统 | ||
1.一种人声识别系统,其特征在于,包括:人声采集模块、预处理模块、声纹特征提取模块、功能切换模块、声纹识别模块和模型训练模块;
所述人声采集模块,与所述预处理模块的输入端连接,用于采集人声后获取声纹信息;
所述预处理模块,与所述声纹特征提取模块的输入端连接,用于将声纹信息进行降噪处理;
所述声纹特征提取模块,与所述功能切换模块的输入端连接,用于提取声纹特征;
所述功能切换模块,用于进行声纹识别和模型训练功能的选择;
所述模型训练模块,与所述功能切换模块的第一输出端连接,用于对所述声纹特征进行模型训练,获得声纹模板;
所述声纹模板库,与所述模型训练模板的输出端连接,用于获取和存储所述声纹模板;
所述声纹识别模块,所述声纹识别模块的输入端与所述功能切换模块的第二输出端连接,所述声纹识别模块的第一输入/输出端与所述声纹模板库的输入/输出端连接,用于根据声纹模板来识别用户身份。
2.根据权利要求1所述的一种人声识别系统,其特征在于:
所述人声采集模块包括:声音收集单元和音量自适应单元;
所述声音收集单元,与所述音量自适应单元的输入端连接,用于收集进行人声识别的用户声音;
所述音量自适应单元,用于对用户声音音量大小的自适应处理,将用户的声音音量大小进行识别模型训练后做总体归一化处理到相同的最大值。
3.根据权利要求1所述的一种人声识别系统,其特征在于:
所述预处理模块包括:降噪单元和信号增强单元;
所述降噪单元,用于对声纹信息进行降噪处理,获得降噪后的声纹信息;采用谱去除法和/或学习同定法和/或降噪自动编码器至少之一进行噪声抑制;
所述信号增强单元与所述降噪单元的输入端连接,用于将所述人声采集模块的声纹信息进行加强。
4.根据权利要求1所述的一种人声识别系统,其特征在于:
所述声纹特征提取模块包括:声纹特征提取单元和语谱图片转换单元;
所述声纹特征提取单元,用于通过训练好的神经网络算法模型,提取用户声音的声纹特征;
所述语谱图片转换单元与所述声纹特征提取单元的输出端连接,用于将获得的所述声纹特征转换为语谱图。
5.根据权利要求1-4任一项所述的一种人声识别系统,其特征在于:
还包括:反馈语音模块和声音输出模块;
所述反馈语音模块,与所述声纹识别模块的输入/输出端连接,获取所述声纹识别模块的识别结果,输出对应语音反馈信号至所述声纹识别模块;
所述声音输出模块,与所述声纹识别模块的第三输入端连接,用于接收并输出所述语音反馈信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京新知艺测科技有限公司,未经南京新知艺测科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367218.0/1.html,转载请声明来源钻瓜专利网。