|
钻瓜专利网为您找到相关结果 20个,建议您 升级VIP下载更多相关专利
- [发明专利]丢包补偿模型训练方法、丢包补偿方法及装置-CN202310118799.3在审
-
李镇权;郑能恒
-
深圳大学
-
2023-02-01
-
2023-06-23
-
G10L19/00
- 本发明提供丢包补偿模型训练方法、丢包补偿方法及装置,包括:获取输入信号和初始丢包补偿模型;基于输入信号,构造与输入信号对应的目标信号;基于初始丢包补偿模型和输入信号,得到重构信号;基于重构信号与目标信号,对初始丢包补偿模型进行训练,得到目标丢包补偿模型。通过本发明,通过对丢包补偿模型进行训练,进一步优化了语音丢包补偿算法采用的损失函数,降低了噪声干扰,避免了丢包补偿模型受误差累积的影响,进而避免了出现重构信号包络异常的情况。通过优化后的损失函数,实现了在降低包络失真的同时,增强模型对于包络的重构能力,进一步提高了补偿信号的语音质量、可懂度和自动语音识别准确率。
- 补偿模型训练方法装置
- [发明专利]一种语音增强方法及系统-CN202011364900.6有效
-
康迂勇;郑能恒
-
深圳大学
-
2020-11-27
-
2022-04-29
-
G10L21/0208
- 本发明公开了一种语音增强方法及系统,方法包括:构建的语音增强网络模型包含两个并行模块:预测自适应权重模块根据输入特征判断信噪比从而通过权重调节语音失真和残留噪声的占比;预测时频掩模模块根据输入特征估计出用于抑制噪声的时频掩模。通过训练网络可以获得根据信噪比自适应的调节增强语音中的语音失真和残留噪声的比重,利用训练好的网络模型用于实际的降噪任务,得到增强的语音信号。本发明使用神经网络自适应调节增强语音中语音失真和残留噪声,以获得更好的语音增强效果,可以根据不同的任务需求训练不同自适应权重范围,获得更加适合相关任务的语音增强算法。
- 一种语音增强方法系统
- [发明专利]一种中英文混合语音识别方法及装置-CN201910794593.6有效
-
郑能恒;容韦聪;史裕鹏
-
深圳大学
-
2019-08-27
-
2022-02-15
-
G10L15/06
- 本发明适用于语音识别技术领域,提供了一种中英文混合语音识别方法及装置,方法包括:获取语音训练样本,语音训练样本采样于中英文语料库,中英文语料库包括中文语料库、英文语料库、中英文混合语料库;通过语音训练样本对LSTM‑CTC端到端网络进行训练,并修改LSTM‑CTC端到端网络的softmax层,以使softmax层输出的字符为Unicode编码方式;根据softmax层输出的字符获得语音识别网络模型;将待识别语音输入语音识别网络模型,并通过RNN‑LM语言模型对语音识别网络模型的输出进行处理,获得基于待识别语音的语音识别结果;其中,RNN‑LM语言模型由语音训练样本的文本训练获得。通过本发明能够有效提高根据LSTM‑CTC端到端网络建立语音识别网络模型的过程中,CTC的解码效率,提升识别性能。
- 一种中英文混合语音识别方法装置
- [发明专利]虚拟听觉重放方法及系统-CN201710075455.3有效
-
郑能恒;袁翔;蔡素到;李斌
-
深圳大学
-
2017-02-13
-
2020-05-19
-
G06F30/20
- 本发明公开了一种虚拟听觉重放方法及系统,该方法包括:利用预置的图像处理算法从耳廓图像中提取N个不同类型的耳廓参数,基于预置的参数间复相关算法及数据库中包含的多个受试者的标准耳廓参数计算该N个不同类型的耳廓参数分别对应的权重系数,并根据该目标对象的N个耳廓参数,及该N个耳廓参数分别对应的权重系数计算该目标对象的耳廓参数与上述多个受试者的标准耳廓参数之间的相似匹配度,并将相似匹配度最高的受试者的HRTF数据作为该目标对象的HRTF数据,基于该目标对象的HRTF数据进行虚拟听觉重放。通过上述方式获取的耳廓参数误差小,准确率高,改善虚拟听觉重放效果,且通过使用权重系数,能够实现更准确的匹配。
- 虚拟听觉重放方法系统
|