[发明专利]一种二值权重卷积神经网络模块及其用于声纹识别的方法有效
申请号: | 202110060392.0 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112863520B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 刘波;吴海舸;张轩;蔡浩;葛伟;杨军 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/18 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 权重 卷积 神经网络 模块 及其 用于 声纹 识别 方法 | ||
本发明公开了一种二值权重卷积神经网络模块及其用于声纹识别的方法。属于人工智能神经网络技术领域。其功能为对采集到的语音特征进行二值化的卷积计算与全连接计算,采用符号判断方式判断输入语音中是否含有目标说话人,并输出判断结果。其核心结构包括地址生成单元、状态机控制单元和复用计算单元。本发明采用二值化的卷积神经网络,极大减少了计算过程中的乘法操作,通过状态机控制单元控制整个网络的操作,通过判断全连接神经元的符号进行说话人判断,简单有效。模块化程度高,结构简单,可行性好,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。
技术领域
本发明涉及人工智能神经网络技术领域,尤其是一种二值权重卷积神经网络模块及其用于声纹识别的方法。
背景技术
声纹识别技术属于语音识别技术的一个分支,实现对说话人的身份的确认的功能。传统上来说,声纹识别技术会采用高斯混合模型来实现,但采用该模型虽然可以保证较为优秀的准确率,但会面临硬件开销大,资源利用率低,无法复用等问题。目前在整个行业对软件模型和硬件结构的优化的追求下,行业内涌现出了很多采用通用卷积神经网络来实现声纹识别的方案,但采用该方案对硬件资源的利用率仍不够高,且相对功耗较高。本发明采用了具有高能源效率和低硬件开销的二值权重卷积神经网络来实现声纹识别方案,用很少的精确度降低换取了硬件面积和能源效率上的大幅度提升,并且网络结构可复用。
发明内容
本发明要解决的技术问题是采用传统方法的实现声纹识别网络系统规模大,功耗大,结构冗余严重,本发明提供一种二值权重卷积神经网络模块及其用于声纹识别的方法,应用于说话人声纹识别以及卷积神经网络二值化。本发明在可重构二值权重神经网络结构下实现了说话人声纹识别,以实现网络模块在接收到说话人语音声纹特征数据后进行分析处理并输出识别结果的功能。本发明在硬件实现时采用了高度复用的设计,在保证了相当的计算精度的同时,对计算的复杂度进行了简化,相对于传统结构对芯片的硬件开销和计算的功耗与延时都进行了较大的优化,并给网络复用与重构做好了准备。
一种二值权重卷积神经网络模块,用于对接受到的说话人语音声纹特征数据依次进行二值化的卷积计算、全连接计算和符号比较计算,判断输入的语音声纹特征数据是否与目标说话人的语音特征相匹配,并输出判断结果。
本发明为实现上述发明目的采用如下技术方案:一种二值权重卷积神经网络模块,包括地址生成单元、状态机控制单元和复用计算单元;状态机控制单元与地址生成单元以及复用计算单元连接;所述状态机控制单元用于控制地址生成单元和复用计算单元,完成神经网络权重参数与语音声纹特征数据读写与计算;地址生成单元用于产生神经网络权重参数的读取地址、语音声纹特征数据的读写地址;复用计算单元对输入的语音声纹特征数据依次进行二值化的卷积计算、全连接计算和符号比较计算;判断输入的语音声纹特征数据是否与目标说话人的语音特征相匹配,并输出判断结果。
所述地址生成单元包括数据读地址模块、计算结果写地址模块、语音数据写地址模块、语音数据读地址模块、权重参数写地址模块和读写地址选择模块。
所述数据读地址模块用于生成读取接收到的说话人声纹特征数据时的基址,所述计算结果写地址模块用于生成神经网络计算完毕后写入结果的目标地址,所述语音数据写地址模块用于生成训练时存储目标语音数据时的目标地址,所述语音数据读地址模块用于生成神经网络加载语音声纹特征数据时的对应地址,所述权重参数写地址模块用于按预设逻辑生成存储训练时得到的网络权重参数的目标地址。所述读写地址选择模块受状态机控制单元直接控制,数据读地址模块、计算结果写地址模块、语音数据写地址模块、语音数据读地址模块和权重参数读地址模块的输出,就是读写地址选择模块的输入数据,根据当前所处的工作状态与计算状态,状态机控制单元发出控制信号到读写地址选择模块,控制读写地址选择模块数据的输出,读写地址选择模块根据状态机控制单元的控制信号选择性的输出其中一个地址。
优选的,所述复用计算单元包括特征缓冲器模块、二维卷积计算模块、归一化单元、全连接缓冲器、智能计算模块组和阈值比较模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110060392.0/2.html,转载请声明来源钻瓜专利网。