[发明专利]一种人声识别系统在审
申请号: | 202110367218.0 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113077794A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 程杰 | 申请(专利权)人: | 南京新知艺测科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/18 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 龙涛 |
地址: | 212000 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人声 识别 系统 | ||
本发明公开了一种人声识别系统,应用于声音识别技术领域,包括:人声采集模块、预处理模块、声纹特征提取模块、功能切换模块、模型训练模块和声音识别模块。本发明可使输入特征更完善、噪声更小、算法精度更高;采用深度神经卷积网络算法进行声音的高维特征提取分类,对说话人声音特征提取直接对说话人的声音特征进行直接辨识,避免通过说话人的说话内容进行识别的缺陷,提高辨识准确度。
技术领域
本发明涉及声音识别技术领域,尤其涉及一种人声识别系统。
背景技术
语音识别技术是通过机器的识别和理解过程将人发出的声音、字节或短语转换成相应的文字或符号,或者给出响应的一种信息技术。声纹是用电声学仪器显示的携带言语信息的声波频谱,人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官,如,舌、牙齿、喉头、肺以及鼻腔,在尺寸和形态上个体差异很大,因此,任何两个人的声纹图谱均会存在差异。不同的用户讲话时对应的声波频谱存在差异性,故可通过声纹识别出唯一的用户。
现有技术中,声纹识别方式存在识别不准确的缺陷,与人脸识别、指纹识别等身份识别方式相比,由于其缺陷的存在,至今应用并不广泛。
因此,提供一种识别准确的人声识别系统,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种人声识别系统,可通过声纹准确识别出用户身份的技术效果。
为了实现上述目的,本发明采用如下技术方案:
一种人声识别系统,人声采集模块、预处理模块、声纹特征提取模块、功能切换模块、声纹识别模块和模型训练模块;
所述人声采集模块,与所述预处理模块的输入端连接,用于采集人声后获取声纹信息;
所述预处理模块,与所述声纹特征提取模块的输入端连接,用于将声纹信息进行降噪处理;
所述声纹特征提取模块,与所述功能切换模块的输入端连接,用于提取声纹特征;
所述功能切换模块,用于进行声纹识别和模型训练功能的选择;
所述模型训练模块,与所述功能切换模块的第一输出端连接,用于对所述声纹特征进行模型训练,获得声纹模板;
所述声纹模板库,与所述模型训练模板的输出端连接,用于获取和存储所述声纹模板;
所述声纹识别模块的输入端与所述功能切换模块的第二输出端连接,所述声纹识别模块的第一输入/输出端与所述声纹模板库的输入/输出端连接,用于根据声纹模板来识别用户身份。
优选的,所述人声采集模块包括:声音收集单元和音量自适应单元;
所述声音收集单元,与所述音量自适应单元的输入端连接,用于收集进行人声识别的用户声音;所述音量自适应单元,用于对用户声音音量大小的自适应处理,将用户的声音音量大小进行识别模型训练后做总体归一化处理到相同的最大值。
该技术方案所实现的技术效果:用户声音音量经过处理得到相同最大值,使声音信号强度平衡便于进行声纹特征提取。
优选的,所述预处理模块包括:降噪单元和信号增强单元;
所述降噪单元,用于对声纹信息进行降噪处理,获得降噪后的声纹信息;采用了谱去除法和/或学习同定法和/或降噪自动编码器至少之一进行噪声抑制;所述信号增强单元与所述降噪单元的输入端连接,用于将所述人声采集模块的声纹信息进行加强。
该技术方案所实现的技术效果:降低用户声纹信息的噪声,提高最终辨别的准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京新知艺测科技有限公司,未经南京新知艺测科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367218.0/2.html,转载请声明来源钻瓜专利网。