专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果31个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于双层字典学习的单通道语音增强方法-CN201911021192.3有效
  • 孙林慧;吴子皓;谢可丽 - 南京邮电大学
  • 2019-10-25 - 2023-09-12 - G10L21/0208
  • 一种基于双层字典学习的单通道语音增强方法,包括如下步骤,步骤S1、对输入的语音和噪声样本进行采集、预处理及混合后,将其训练为稀疏子字典,稀疏子字典再通过约束目标优化函数获取单层联合字典和双层联合字典;步骤S2、对带噪语音进行增强处理,并将带噪语音在双层联合字典的第一层联合字典上投影,通过比较增强后的带噪语音的能量与预设能量阈值的大小,判断是否在第二层联合字典上投影;步骤S3、对所提出的基于双层字典学习的单通道语音增强方法进行性能评估。该方法根据单层字典增强后的信号中的语音和噪声的共性,依据阈值选择是否需要更加冗余的联合字典,有效减少“交叉投影”现象,提高联合字典的区分性。
  • 一种基于双层字典学习通道语音增强方法
  • [发明专利]基于嵌套深度神经网络的语音情感识别方法和系统-CN202110670269.0有效
  • 蔡芃芃;周茜璇;孙林慧;查亦文 - 南京邮电大学
  • 2021-06-17 - 2023-06-20 - G10L25/63
  • 本发明公开了一种基于嵌套深度神经网络的语音情感识别方法和系统,方法包括:构建MFCC数据集;基于深度神经网络构建语音情感识别模型,采用MFCC数据集对语音情感识别模型进行初步训练,遍历得到不同参数组对应的语音情感的识别率;结合不同参数组及其对应的识别率,生成识别率数据集;基于深度神经网络构建参数拟合模型,用于对导入的识别率数据集进行拟合,得到最大识别率对应的参数组;将得到的最大识别率对应的参数组导入语音情感识别模型,利用MFCC数据集对语音情感识别模型进行训练,得到最终的语音情感识别模型。本发明通过利用嵌套式的深度神经网络不断优化输入神经网络的参数,大幅提高了语音情感的识别率。
  • 基于嵌套深度神经网络语音情感识别方法系统
  • [发明专利]基于DNN与GMM模型的说话人识别方法-CN201810518855.1有效
  • 孙林慧;顾婷 - 南京邮电大学
  • 2018-05-25 - 2023-06-02 - G10L17/04
  • 本发明揭示了一种基于DNN与GMM模型的说话人识别方法,包括如下步骤:在给定特征参数MFCC的前提下,基于GMM‑SVM提取超矢量实现数据降维,并拟构建相关超矢量来提取携带更丰富的说话人身份信息的特征;构造深度信念网络体系结构来提取说话人深度特征;结合相关超矢量和瓶颈特征以构建新的说话人辨认系统。应用本发明的该说话人识别方法,较之于传统此类单独方法具备突出的实质性特点和显著的进步性:该方法弥补了传统特征参数不能挖掘语音信号深层结构信息的缺点;与传统GMM超矢量相比,相关超矢量在实现数据降维的同时在一定程度上提高了识别率,并且减少了系统建模时间。
  • 基于dnngmm模型说话识别方法
  • [发明专利]基于深度学习的跨语料库语音情感识别方法-CN202210492667.2在审
  • 孙林慧;赵敏;王舜;李平安 - 南京邮电大学
  • 2022-05-07 - 2022-11-11 - G10L25/63
  • 本发明提出了一种基于深度学习的跨语料库语音情感识别方法,属于语音识别技术领域,包括以下步骤:步骤1:提取语音信号的MFCC特征及其统计特征,将其作为系统的输入,表征与情感分类标签高度相关的信息;步骤2:将这两个语料库的统计特征作为DNN的输入,用于训练DNN模型,建立源域特征到目标域特征的迁移学习关系,实现两个域统计特征的变换对齐,提升两个语料库特征之间的领域自适应能力;步骤3:根据混淆度矩阵构建以CNN为树节点的多级分类模型;步骤4:对齐后的源域数据作为该CNN‑决策树模型的输入进行最终情感分类评估。
  • 基于深度学习语料库语音情感识别方法
  • [发明专利]一种基于深度神经网络的单通道语音分离方法-CN202210598726.4在审
  • 孙林慧;梁文清;袁硕;李平安 - 南京邮电大学
  • 2022-05-30 - 2022-11-01 - G10L21/0272
  • 本发明公开了一种基于多重联合约束双输出深度神经网络的单通道语音分离方法,首先提出了三种联合约束损失函数,并进行整合,提出一种多重联合约束损失函数,用于训练双输出深度神经网络以解决单通道语音分离问题。该多重联合约束损失函数充分利用了网络输出值之间的关系,输出值与目标语音特征之间的关系,估计目标语音特征与混合语音特征之间的关系,在该损失函数指导下训练的深度神经网络可以输出更精确的预测值。此外,本发明采用优化思想求解了各约束项所对应的最优权重系数,使每项的约束力度更精准,进一步提升了分离系统的性能。实验结果表明,相比基于传统损失函数的方法,该方法的性能更加优越,能够更有效地分离出目标语音。
  • 一种基于深度神经网络通道语音分离方法
  • [发明专利]单通道盲源分离方法-CN201810599522.6有效
  • 孙林慧;谢可丽 - 南京邮电大学
  • 2018-06-11 - 2022-09-27 - G06K9/62
  • 本发明提供一种单通道盲源分离方法,通过训练阶段,给定不同源语音信号训练样本Ti,求得对应的初始身份子字典Di和初始公共子字典Dc,从而得到包括初始身份子字典Di和初始公共子字典Dc的联合字典,采用优化函数迭代更新联合字典;采用稀疏编码算法求解混合信号在联合字典下的稀疏投影系数;根据子字典和稀疏向量恢复各个源信号;针对联合字典区分能力不强产生的“交叉投影”问题,本发明采用高区分性的联合字典,相比于其他的基于稀疏表示的单通道盲源分离算法,减少了源干扰,分离质量有了明显提高。
  • 通道分离方法
  • [发明专利]一种基于挑选峰的连续语音共振峰提取方法-CN202210492452.0在审
  • 邹欣航;叶蕾;孙林慧;陈雪红 - 南京邮电大学
  • 2022-05-07 - 2022-09-16 - G10L21/003
  • 本发明公开了一种基于挑选峰的连续语音共振峰提取方法,包括:对输入的单帧语音进行预处理操作;采用线性预测法,初步估算一帧语音频谱包络中的峰值;设立参考点和共振峰槽,然后利用挑选峰方法建立峰值与参考点之间的映射关系;利用峰值和参考点间的映射关系和共振峰槽确定一帧语音的共振峰;针对连续语音进行共振峰估算:将连续语音按照不同帧数进行分帧,利用如上算法循环100次取得不同帧数试验下的共振峰参数,对100次循环后的结果进行平均,经过平滑处理后得到最终结果。本发明方法可消除合并峰和假峰的影响,收敛速度快,鲁棒性强。
  • 一种基于挑选连续语音共振提取方法
  • [发明专利]基于多领域统计特征和改进CNN的含噪语音情感识别方法-CN202210494189.9在审
  • 孙林慧;王舜;赵敏;叶蕾 - 南京邮电大学
  • 2022-05-07 - 2022-09-13 - G10L25/63
  • 本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法,属于语音识别领域,包括以下步骤:步骤1:首先对语料库中的纯净语音进行加噪处理,其次提取语音信号的相关多领域特征,采用统计函数对已提取的特征进行筛选,降低特征冗余度,得到冗余度低、情感区分度高的多领域统计特征;步骤2:搭建基于语音增强联合约束CNN‑DNN的框架;步骤3:将多领域统计特征作为系统模型的输入,提取与情感分类标签高度相关且对噪声具有鲁棒性的信息,得到输出层的情感分类结果;步骤4:对所提出的一种基于多领域统计特征和语音增强联合约束CNN‑DNN的噪声环境下语音情感识别方法进行性能评估。
  • 基于领域统计特征改进cnn语音情感识别方法
  • [发明专利]一种基于共振峰分布的改进MFCC参数语音识别算法-CN202210533421.5在审
  • 邹欣航;叶蕾;孙林慧;吕斌 - 南京邮电大学
  • 2022-05-13 - 2022-08-30 - G10L25/24
  • 本发明公开了一种基于共振峰分布的改进MFCC参数语音识别算法,包括分割语音频谱得到不同频谱区间,利用线性预测法和倒谱法分别估算一帧语音的共振峰频率分布;统计不同频谱区间上共振峰频率分布,依据共振峰在不同频谱区间上的分布,利用熵权法求取各个区间在一帧语音音频上的权重;进一步计算MFCC参数,依据Mel频率和实际频率的关系,找到MFCC参数对应的区间权重,进行乘积得到改进的MFCC参数。本发明采用了本发明通过熵权法对各频率区间求得权重系数(以三种方法分别求取的共振峰频率个数为标准),提取共振峰频率特征得到的权重系数与多通道梅尔滤波器组对应频率区间通道输出之间的乘积,从而能够实现较高的语音识别率。
  • 一种基于共振分布改进mfcc参数语音识别算法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top