专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果41个,建议您升级VIP下载更多相关专利
  • [发明专利]语音识别方法、设备和存储介质-CN202310680032.X在审
  • 史莫晗;杜志浩;陈谦;俞帆;张仕良;李泱泽;张结;戴礼荣 - 阿里巴巴(中国)有限公司
  • 2023-06-08 - 2023-09-29 - G10L15/20
  • 本申请提供一种语音识别方法、设备和存储介质,方法包括:通过语音识别编码器获取语音信号对应的第一向量表示,通过说话者编码器获取语音信号对应的第二向量表示,通过文本编码器对语音识别解码器已经输出的前n‑1个字进行编码处理,得到第n‑1个字对应的第三向量表示。将第一向量表示、第二向量表示和第三向量表示输入说话者解码器中,获得第n个字对应的说话者向量表示,根据该说话者向量表示分别与多个说话者的画像特征向量之间的相关性系数,确定第n个字对应的说话者。将第一向量表示、前n‑1个字以及相关性系数对多个说话者的画像特征向量的加权和,输入语音识别解码器,获得第n个字,提高了各个字对应的说话者识别结果的准确性。
  • 语音识别方法设备存储介质
  • [发明专利]一种声纹向量提取方法、装置、设备及存储介质-CN202110505478.X有效
  • 李晋;方昕;褚繁;高天;戴礼荣 - 科大讯飞股份有限公司
  • 2021-05-10 - 2023-08-01 - G10L17/00
  • 本申请提供了一种声纹向量提取方法、装置、设备及存储介质,方法包括:获取目标语音数据对应的语谱片段序列,基于语谱片段序列和预先建立的第一声纹提取模型确定声纹向量,第一声纹提取模型以第一训练语谱片段为训练样本,采用第二声纹提取模型辅助训练得到,第一声纹提取模型的训练目标包括:使基于第一声纹向量和第二声纹向量分别针对设定身份标签预测的概率趋于一致,第一声纹向量为第一声纹提取模型针对第一训练语谱片段提取的声纹向量,第二声纹向量为第二声纹提取模型针对第二训练语谱片段提取的声纹向量,第二训练语谱片段为对第一训练语谱片段的时序进行打乱后的语谱片段。本申请提供的声纹向量提取方法不受语音时序信息的干扰。
  • 一种声纹向量提取方法装置设备存储介质
  • [发明专利]分布式语音增强方法和语音增强装置-CN202310214884.X在审
  • 张结;许露真;戴礼荣 - 中国科学技术大学
  • 2023-03-02 - 2023-06-23 - G10L21/0216
  • 本公开提供了一种分布式语音增强方法和语音增强装置。该方法包括根据语音参数集构建最优通信概率函数,其中,语音参数集包括权衡因子、更新矩阵第二大特征值和平均传输能耗,平均传输能耗表征在多个节点之间进行语音传输时信号能量的损耗,多个节点包括语音主节点和多个语音辅节点;对最优通信概率函数进行求解,得到节点对通信概率矩阵,其中,节点对通信概率矩阵表征语音主节点选择任意一个语音辅节点构成节点对的概率;基于节点对通信概率矩阵,利用预设处理规则对语音主节点和多个语音辅节点接收的多个声音信号进行处理,得到波束形成信号模型;将从语音主节点获取的输入语音信息输入至波束形成信号模型,输出增强语音信息。
  • 分布式语音增强方法装置
  • [发明专利]一种双层自回归解码的序列到序列语音合成方法及系统-CN202010672991.3有效
  • 周骁;凌震华;戴礼荣 - 中国科学技术大学
  • 2020-07-14 - 2022-12-30 - G10L13/047
  • 本发明提出一种双层自回归解码的序列到序列语音合成方法及系统,系统包括编码器和解码器,所述解码器包括:音素级表征模块、音素级预测模块、帧级预测模块;所述编码器将音素名、音调和韵律短语边界信息用向量表征,然后使用卷积神经网络和双向长短时记忆网络将这些信息编码融合得到句子中每个音素的上下文单元表征;所述音素级表征模块,通过帧一级的长短时记忆网络(LSTM)和池化处理获得每个音素单元的声学单元表征;所述音素级预测模块,采用音素级自回归结构来预测当前音素的声学单元表征并建立连续音素之间的依赖关系;所述帧级预测模块,通过解码器LSTM来预测帧级的声学特征。
  • 一种双层回归解码序列语音合成方法系统
  • [发明专利]一种基于参考麦克风优化的多通道语音增强方法-CN202110505085.9有效
  • 张结;陈星宇;戴礼荣 - 中国科学技术大学
  • 2021-05-10 - 2022-07-15 - G10L21/0216
  • 本发明公开了一种基于参考麦克风优化的多通道语音增强方法,包括:步骤1,建立低秩近似多通道维纳滤波器;步骤2,建立输出信噪比数学模型;步骤3,选择参考麦克风:基于步骤2建立的输出信噪比数学模型,选定两个麦克风,并分别计算两个麦克风的输出信噪比差值,选定输入信噪比最大的麦克风作为参考麦克风;步骤4,波束形成得出增强语音信号:将步骤2中选定的秩和步骤3选择的参考麦克风代入步骤1中建立的低秩近似多通道维纳滤波器中,将待增强多麦克风语音信号与该低秩近似多通道维纳滤波器在短时频域做加权求和波束形成的内积运算,得到的结果即为单通道增强后语音信号。该方法有效降低了参考麦克风选择的时间复杂度,提升了多麦克风语音增强及语音识别性能。
  • 一种基于参考麦克风优化通道语音增强方法
  • [发明专利]多模态语音识别模型的训练方法、语音识别方法及设备-CN202210235261.6在审
  • 张自强;戴礼荣 - 中国科学技术大学
  • 2022-03-11 - 2022-07-08 - G10L15/02
  • 本发明公开了一种多模态语音识别模型的训练方法,包括:利用多模态语言识别模型处理无标签的音视频数据,得到无标签的音视频特征;利用跨模态采样机制对无标签的音视频特征进行采样,得到样本表征;利用多模态语音识别模型处理无标签的音视频特征,得到无标签的融合表征;利用预训练损失函数处理无标签的融合表征和样本表征并根据预训练损失值优化多模态语音识别模型;根据预设任务需求,利用多模态语音识别模型处理带标签的音视频数据,得到带标签的融合表征;利用微调损失函数处理带标签的融合表征并根据微调损失值优化多模态语音识别模型;迭代进行预训练优化操作和微调优化操作,直到微调损失值满足预设条件,得到训练完成的多模态语音识别模型。
  • 多模态语音识别模型训练方法设备
  • [发明专利]基于参数化无约束波束形成的双耳语音增强方法及装置-CN202210150297.4在审
  • 张结;戴礼荣 - 中国科学技术大学
  • 2022-02-18 - 2022-05-27 - G10L21/0232
  • 本公开提供了一种基于参数化无约束波束形成的双耳语音增强方法,包括:对M个麦克风获取的带噪声的目标语音信号进行短时傅立叶变换,使带噪声的目标语音信号在短时傅立叶变换域生成第一语音信号矩阵;基于所述第一语音信号矩阵,得到滤波器系数;基于滤波器系数,得到双耳语音增强波束;调节双耳语音增强波束的语音失真参数,得到输出语音信号。本公开实施例提供的存在闭式解的基于参数化无约束波束形成的双耳语音增强方法,具有高效的计算优势,引入语音增强和噪声空间线索保存这两个平衡因子,在满足同等空间线索保存精度的情况下比BMWF‑PNE或BMWF‑RTF方法的降噪性能更优。
  • 基于参数无约束波束形成耳语增强方法装置
  • [发明专利]事件分析模型的训练方法、事件分析方法及其装置-CN202111495065.4在审
  • 朱秋实;张结;陈星宇;戴礼荣 - 中国科学技术大学
  • 2021-12-08 - 2022-04-08 - G10L25/24
  • 本公开提供了一种事件分析模型的训练方法、事件分析方法及其装置。该事件分析模型的训练方法包括:获取训练样本数据集,其中,训练样本数据集中的训练样本包括与多个训练音频信息对应的多个梅尔频谱倒谱特征训练矩阵以及对应的标签数据;针对于每种训练音频信息,利用多个梅尔频谱倒谱特征训练矩阵和标签数据训练一个第一初始神经网络得到第一神经网络;根据多个第一神经网络的模型参数对多个第一神经网络进行融合,得到融合模型;利用融合模型初始化多个第二初始神经网络,得到多个初始化后的第二初始神经网络;利用多个目标维度特征训练多个初始化后的第二初始神经网络,得到经训练的事件分析模型,目标维度特征是根据训练音频信息生成的。
  • 事件分析模型训练方法及其装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top