“郑能恒”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果20个，建议您升级VIP下载更多相关专利

[发明专利]一种基于神经网络的语音增强方法、装置、设备及介质-CN202310122355.7在审
发明人：欧阳康;郑能恒 -专利权人：深圳大学
申请日： 2023-02-01 - 公布日： 2023-07-14 - 主分类号： G10L21/0208 文献下载
摘要：本申请提供了一种基于神经网络的语音增强方法、装置、设备及介质。所述方法包括：将对应于目标语音的第一频域特征输入至第一神经网络模型进行处理，得到第一频带增益；将对应于目标语音的第二频域特征以及第一频带增益输入至第二神经网络模型进行处理，得到第二频带增益；对第一频带增益、第二频带增益以及目标语音频谱进行运算，得到增强语音。通过本申请方案的实施，分别将对应于目标语音的第一频域特征以及第二频域特征输入至两个神经网络模型，再对两个神经网络模型输出的频带增益以及目标语音频谱进行运算，即可得到增强语音，可有效降低网络结构的复杂度，提高语音的感知质量。
一种基于神经网络语音增强方法装置设备介质

[发明专利]声源波达方向估计模型训练和声源波达方向估计方法-CN202011045128.1有效
发明人：刘容良;郑能恒 -专利权人：深圳大学
申请日： 2020-09-28 - 公布日： 2023-06-27 - 主分类号： G01S3/808 文献下载
摘要：本发明公开了一种声源波达方向估计模型训练和声源波达方向估计方法，其中声源波达方向估计模型训练方法，包括：获取基于不同声场环境下多种类型的语音特征构建的模型训练数据；将所述模型训练数据输入到目标神经网络模型，对所述目标神经网络模型进行训练，直至模型估计结果满足估计要求，得到声源波达方向估计模型，其中所述目标神经网络模型包括注意力机制模块和特征融合模块。通过使用多种不同类型的语音特征构建的模型训练数据进行模型训练，使得多种不同类型的语音特征可以进行互补，提高了特征维度，继而提高了训练得到的模型估计结果的准确性。
声源方向估计模型训练方法

[发明专利]丢包补偿模型训练方法、丢包补偿方法及装置-CN202310118799.3在审
发明人：李镇权;郑能恒 -专利权人：深圳大学
申请日： 2023-02-01 - 公布日： 2023-06-23 - 主分类号： G10L19/00 文献下载
摘要：本发明提供丢包补偿模型训练方法、丢包补偿方法及装置，包括：获取输入信号和初始丢包补偿模型；基于输入信号，构造与输入信号对应的目标信号；基于初始丢包补偿模型和输入信号，得到重构信号；基于重构信号与目标信号，对初始丢包补偿模型进行训练，得到目标丢包补偿模型。通过本发明，通过对丢包补偿模型进行训练，进一步优化了语音丢包补偿算法采用的损失函数，降低了噪声干扰，避免了丢包补偿模型受误差累积的影响，进而避免了出现重构信号包络异常的情况。通过优化后的损失函数，实现了在降低包络失真的同时，增强模型对于包络的重构能力，进一步提高了补偿信号的语音质量、可懂度和自动语音识别准确率。
补偿模型训练方法装置

[发明专利]一种人工耳蜗信号处理方法、装置及计算机可读存储介质-CN201910999264.5有效
发明人： 郑能恒;史裕鹏;康迂勇;张伟 -专利权人：深圳大学
申请日： 2019-10-21 - 公布日： 2023-06-13 - 主分类号： A61N1/36 文献下载
摘要：根据本发明实施例公开的人工耳蜗信号处理方法、装置及计算机可读存储介质，首先获取训练语音信号，并将训练语音信号经过预处理后输入至包络提取网络进行网络训练，其中，包络提取网络包括依次顺序连接的三个深度神经网络；然后将采集的实时语音信号经预处理后输入至训练完成的包络提取网络，提取个数对应于体内植入电极个数的通道包络；最后对所提取的通道包络依次进行非线性压缩、通道选择、电极映射以及脉冲调制，输出目标数量的电极刺激信号至对应数量的体内植入电极。通过本发明所提供的计算复杂度较低的轻量级包络提取网络，有效降低了功率消耗，提升了处理效率以及降噪处理效果，并保证了CI信号处理与降噪的无缝融合。
一种人工耳蜗信号处理方法装置计算机可读存储介质

[发明专利]一种运动想象反馈方法、系统及存储介质-CN202110439396.X有效
发明人：李俊翰;郑能恒;戚可盈;曹锦鹏 -专利权人：深圳大学
申请日： 2021-04-22 - 公布日： 2023-01-24 - 主分类号： G06F3/01 文献下载
摘要：本发明公开了一种运动想象反馈方法、系统及存储介质，该方法包括：获取受试者在不同预设动作下的静息态数据和运动想象态数据；根据静息态数据和运动想象态数据计算不同预设动作下的脑电源成像图像；将不同预设动作下脑电源成像图像和预设脑电源成像图像进行对比，确定所述受试者的最优想象动作。通过实施本发明，通过预先确定多个预设动作，获取不同预设动作的静息态数据和运动想象态数据，采用脑电源成像算法确定不同预设动作的脑电源成像图像，并将其和预设脑电源成像图像进行对比，从而确定相应受试者的最优想象动作。获取受试者采用该想象动作想象的脑电信号进行解码，能够提高信号解码准确率。
一种运动想象反馈方法系统存储介质

[发明专利]一种基于生成式对抗网络的语音处理方法及装置-CN201910865696.7有效
发明人： 郑能恒;史裕鹏;容韦聪;康迂勇 -专利权人：深圳大学
申请日： 2019-09-09 - 公布日： 2022-05-27 - 主分类号： G10L21/038 文献下载
摘要：本发明适用于语音通信技术领域，提供了一种基于生成式对抗网络的语音处理方法及装置，方法包括获取语音训练样本，语音训练样本包括N组完整语音样本以及与完整语音样本对应的丢包语音样本、K组宽带语音样本以及与宽带语音样本对应的窄带语音样本；将语音训练样本放入生成式对抗网络分别进行基于丢包语音样本和完整语音样本的丢包补偿模型训练、基于宽带语音样本和窄带语音样本的频带扩展模型训练，获得由丢包补偿模型和频带扩展模型构成的语音处理系统；再通过语音处理系统处理待处理的原始语音，获得丢包补偿或频带扩展后的增强语音。通过本发明可以提高语音处理中基于丢包语音的丢包补偿处理效率，以及基于窄带语音的频带扩展处理性能。
一种基于生成对抗网络语音处理方法装置

[发明专利]一种语音增强方法及系统-CN202011364900.6有效
发明人：康迂勇;郑能恒 -专利权人：深圳大学
申请日： 2020-11-27 - 公布日： 2022-04-29 - 主分类号： G10L21/0208 文献下载
摘要：本发明公开了一种语音增强方法及系统，方法包括：构建的语音增强网络模型包含两个并行模块：预测自适应权重模块根据输入特征判断信噪比从而通过权重调节语音失真和残留噪声的占比；预测时频掩模模块根据输入特征估计出用于抑制噪声的时频掩模。通过训练网络可以获得根据信噪比自适应的调节增强语音中的语音失真和残留噪声的比重，利用训练好的网络模型用于实际的降噪任务，得到增强的语音信号。本发明使用神经网络自适应调节增强语音中语音失真和残留噪声，以获得更好的语音增强效果，可以根据不同的任务需求训练不同自适应权重范围，获得更加适合相关任务的语音增强算法。
一种语音增强方法系统

[发明专利]一种可调噪声抑制深度的神经网络语音增强方法-CN202210018367.0在审
发明人：谢福仕;欧阳康;郑能恒 -专利权人：深圳大学
申请日： 2022-01-07 - 公布日： 2022-04-22 - 主分类号： G10L15/20 文献下载
摘要：本发明涉及语音处理技术领域，具体涉及一种可调噪声抑制深度的神经网络语音增强方法。该方法包括：将理想数据的带噪语音进行特征提取的结果作为网络模型的输入进行训练，网络输出目标为目标增益函数，优化网络输出的增益函数；在网络模型训练中重构损失函数，对网络模型进行优化，使网络模型从带噪语音特征中映射出最优增益函数。本发明通过设置额外的噪声抑制模块解决了目前基于TMF的深度神经网络语音增强算法的噪声残留问题；噪声抑制模块可以在原有的增强效果上进一步提高语音质量，通过降噪深度调节因子，可以根据日常应用需求，调整合适的降噪深度。
一种可调噪声抑制深度神经网络语音增强方法

[发明专利]一种基于分布式阵列的语音数据训练方法、识别方法-CN202111681324.2在审
发明人：卢卓城;谢福仕;郑能恒 -专利权人：深圳大学
申请日： 2021-12-28 - 公布日： 2022-03-18 - 主分类号： G10L15/06 文献下载
摘要：本发明公开一种基于分布式阵列的语音数据训练方法、识别方法，其中训练方法包括：确定各麦克风阵列语音数据及其最优麦克阵列标签信号；输入各麦克风阵列语音数据和最优麦克风阵列标签信号至神经网络模型训练，提取两个不同通道的麦克风相位特征和任一通道的麦克风语音数据的能量特征进行拼接；逐步优化神经网络模型直至其输出最优语音信号。本发明通过分布式阵列的语音数据训练方法，利用神经网络模型训练输出分布式麦克风阵列语音数据的最优语音信号，可以精确识别出最优声源的语音信号，并且基于多通道注意力特征融合网络模型识别训练结果，显著提高了语音识别性能，最终保证了语音识别的精度，满足远场拾音环境下的语音识别需求。
一种基于分布式阵列语音数据训练方法识别

[发明专利]一种中英文混合语音识别方法及装置-CN201910794593.6有效
发明人： 郑能恒;容韦聪;史裕鹏 -专利权人：深圳大学
申请日： 2019-08-27 - 公布日： 2022-02-15 - 主分类号： G10L15/06 文献下载
摘要：本发明适用于语音识别技术领域，提供了一种中英文混合语音识别方法及装置，方法包括：获取语音训练样本，语音训练样本采样于中英文语料库，中英文语料库包括中文语料库、英文语料库、中英文混合语料库；通过语音训练样本对LSTM‑CTC端到端网络进行训练，并修改LSTM‑CTC端到端网络的softmax层，以使softmax层输出的字符为Unicode编码方式；根据softmax层输出的字符获得语音识别网络模型；将待识别语音输入语音识别网络模型，并通过RNN‑LM语言模型对语音识别网络模型的输出进行处理，获得基于待识别语音的语音识别结果；其中，RNN‑LM语言模型由语音训练样本的文本训练获得。通过本发明能够有效提高根据LSTM‑CTC端到端网络建立语音识别网络模型的过程中，CTC的解码效率，提升识别性能。
一种中英文混合语音识别方法装置

[发明专利]预测风速的方法、装置、计算机设备和存储介质-CN202110779737.8在审
发明人：王霄雪;郑能恒 -专利权人：深圳大学
申请日： 2021-07-09 - 公布日： 2021-10-29 - 主分类号： G06Q10/04 文献下载
摘要：本申请涉及气象信息技术领域，提供了一种预测风速的方法、装置、设备和介质。本申请能够提高风速预测的准确性。该方法包括：获取待预测点和关联观测点各自所处的区域块对应的区域形态特征，以及确定待预测点和关联观测点各自的高度，确定待预测点与关联观测点间的距离；获取关联观测点在待预测时间的实测风速；根据区域形态特征、高度、距离和实测风速得到模型输入数据并将该模型输入数据输入至预先构建的风速预测模型；根据该风速预测模型输出的风速预测结果得到待预测点在待预测时间的预测风速。
预测风速方法装置计算机设备存储介质

[发明专利]麦克风阵列信号处理方法、系统、计算机设备及存储介质-CN202110558347.8在审
发明人：邓刚;赵宏亮;郑能恒;陈绍林 -专利权人：深圳市长丰影像器材有限公司
申请日： 2021-05-21 - 公布日： 2021-08-24 - 主分类号： G10L21/0216 文献下载
摘要：本发明实施例公开了一种麦克风阵列信号处理方法、系统、计算机设备及存储介质。该方法包括：采集待处理的音频数据；构造全频带的最小范数滤波器，并确定最小范数滤波器在预设方向上的波束模式；根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带；将划分得到的各个子带对应的子阵滤波器按频率进行合成，以得到目标滤波器；使用目标滤波器对音频数据进行分子带处理，以得到处理后的目标音频数据。本发明实施例所提供的麦克风阵列信号处理方法，通过子带合成的技术解决了最小范数滤波器算法所形成的波束模式在高频部分不稳定的问题，从而提高了麦克风阵列的指向性和空间滤波能力。
麦克风阵列信号处理方法系统计算机设备存储介质

[发明专利]声纹识别方法、电子装置及计算机可读存储介质-CN201810688682.8有效
发明人： 郑能恒;林吉 -专利权人：深圳大学
申请日： 2018-06-28 - 公布日： 2020-08-18 - 主分类号： G10L17/06 文献下载
摘要：一种声纹识别方法、电子装置及计算机可读存储介质，其中，该声纹识别方法包括：获取待分析的语音数据；提取所述语音数据中的变化因子特征，通过易错点分类器，根据所述变化因子特征对所述语音数据进行误判分类，得到所述语音数据在所述K个子系统中被误判的相对误判概率；确定任一子系统对应的相对误判概率与所述K个子系统的平均相对误判概率的偏置量，并根据所述偏置量计算相应子系统的最终融合权重；通过所述最终融合权重对相应的各个子系统的识别结果进行加权，根据加权后各个子系统的识别结果得到所述语音数据的综合识别结果。
声纹识别方法电子装置计算机可读存储介质

[发明专利]特定人群识别方法、电子装置及计算机可读存储介质-CN201810813196.4有效
发明人： 郑能恒;林吉 -专利权人：深圳大学
申请日： 2018-07-23 - 公布日： 2020-08-14 - 主分类号： G10L15/02 文献下载
摘要：一种特定人群识别方法、电子装置及计算机可读存储介质，通过声音数据判定该声音特征属于哪一类特定人群。其中，该特定人群识别方法包括：通过基于ivector的支持向量子系统中的N种类别的分类器，根据所述变化因子特征确定第一初步预测结果；通过基于ivector的逻辑回归子系统中的N‑1级的逻辑回归分类器，根据所述变化因子特征确定第二初步预测结果；通过语音时态神经网络子系统，根据声音数据的滤波器组特征，对所述声音数据的所属类别进行预测，得到第三初步预测结果；根据预设的权重，所述第一初步预测结果，所述第二初步预测结果以及所述第三初步预测结果进行综合判定，获得所述声音数据的所属类别的综合预测结果。
特定人群识别方法电子装置计算机可读存储介质

[发明专利]虚拟听觉重放方法及系统-CN201710075455.3有效
发明人： 郑能恒;袁翔;蔡素到;李斌 -专利权人：深圳大学
申请日： 2017-02-13 - 公布日： 2020-05-19 - 主分类号： G06F30/20 文献下载
摘要：本发明公开了一种虚拟听觉重放方法及系统，该方法包括：利用预置的图像处理算法从耳廓图像中提取N个不同类型的耳廓参数，基于预置的参数间复相关算法及数据库中包含的多个受试者的标准耳廓参数计算该N个不同类型的耳廓参数分别对应的权重系数，并根据该目标对象的N个耳廓参数，及该N个耳廓参数分别对应的权重系数计算该目标对象的耳廓参数与上述多个受试者的标准耳廓参数之间的相似匹配度，并将相似匹配度最高的受试者的HRTF数据作为该目标对象的HRTF数据，基于该目标对象的HRTF数据进行虚拟听觉重放。通过上述方式获取的耳廓参数误差小，准确率高，改善虚拟听觉重放效果，且通过使用权重系数，能够实现更准确的匹配。
虚拟听觉重放方法系统

1
2
下一页»
尾页
共 20 条