[发明专利]掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法有效
申请号: | 201880047142.X | 申请日: | 2018-07-18 |
公开(公告)号: | CN110914899B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | M·德尔克鲁瓦;木下庆介;小川厚德;樋口卓哉;中谷智广 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G10L21/0308 | 分类号: | G10L21/0308;G10L21/0272 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 金玲;崔成哲 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 簇权重计算部(322)根据特定讲话者的语音的信号,使用簇权重计算NN来计算至少任意一个层被分解为多个簇的掩模计算NN的与多个簇各自对应的权重。掩模计算部(302)根据1个以上的讲话者的语音的观测信号的特征量,使用通过由簇权重计算部(322)计算出的权重进行加权后的掩模计算NN来计算从1个以上的讲话者的语音的观测信号的特征量中提取特定讲话者的语音的特征量的掩模。 | ||
搜索关键词: | 计算 装置 权重 学习 神经网络 计算方法 学习方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880047142.X/,转载请声明来源钻瓜专利网。
- 同类专利
- 信号处理装置和方法以及程序-202280018525.0
- 广江厚夫 - 索尼集团公司
- 2022-01-13 - 2023-10-27 - G10L21/0308
- 本技术涉及信号处理装置和方法以及程序,其使得可以提高提取目标声音的准确度。该信号处理装置包括:参考信号生成单元,其基于混合声音的信号来生成与目标声音对应的参考信号,该混合声音的信号借助于布置在不同位置处的多个麦克风来收录并且其中目标声音和除了目标声音之外的声音被混合;以及声源提取单元,其从一帧或多帧的混合声音信号中提取与参考信号相似并目标声音被进一步强化的一帧的信号。本技术可以应用于信号处理装置。
- 掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法-201880047142.X
- M·德尔克鲁瓦;木下庆介;小川厚德;樋口卓哉;中谷智广 - 日本电信电话株式会社
- 2018-07-18 - 2023-10-24 - G10L21/0308
- 簇权重计算部(322)根据特定讲话者的语音的信号,使用簇权重计算NN来计算至少任意一个层被分解为多个簇的掩模计算NN的与多个簇各自对应的权重。掩模计算部(302)根据1个以上的讲话者的语音的观测信号的特征量,使用通过由簇权重计算部(322)计算出的权重进行加权后的掩模计算NN来计算从1个以上的讲话者的语音的观测信号的特征量中提取特定讲话者的语音的特征量的掩模。
- 方法和电子设备-202180059026.1
- 列夫·马哈辛;斯蒂芬·蒂德曼;斯特凡·乌利希;王碧;廖伟翔;光藤祐基 - 索尼集团公司
- 2021-07-30 - 2023-06-02 - G10L21/0308
- 一种方法包括:基于音频波形确定至少一个音频事件;以及确定该音频事件的深度伪造概率。
- 声音信号分离装置和声音信号分离方法-201880085821.6
- 齐藤辰彦;川岛启吾;石井纯;冈登洋平 - 三菱电机株式会社
- 2018-01-15 - 2023-04-04 - G10L21/0308
- 在声音信号分离装置(1)中,判定部(6)判定在由信号再生成部(5)再生成的每个成分的声音信号中是否混合存在来自多个声源的成分,当判定为混合存在多个成分时,反复执行特征量提取部(2)、数据估计部(3)、数据分类部(4)以及信号再生成部(5)的一系列处理,直到再生成了每个声源的成分的声音信号为止。
- 音源分离程序、音源分离方法以及音源分离装置-202180017009.1
- 小野顺贵;罗宾·谢伊布勒 - 东京都公立大学法人
- 2021-02-26 - 2022-11-01 - G10L21/0308
- 音源分离程序使计算机执行:获取音响信号,将获取到的音响信号从时域转换到频域,对于转换到频域的音响信号而言,进行对分离矩阵基于初等行变换的更新并将包含分离向量的二次形式和分离矩阵的行列式在内的目标函数迭代最小化,从而进行音源分离。
- 空间相关矩阵估计装置、空间相关矩阵估计方法和记录介质-201680069908.5
- 中谷智广;伊藤信贵;樋口卓哉;荒木章子;吉冈拓也 - 日本电信电话株式会社
- 2016-12-01 - 2021-11-23 - G10L21/0308
- 根据在目标声源和背景噪声混合存在的状况下在不同位置处收录的观测信号来计算观测特征量矢量,估计与目标声源对应的掩码和与背景噪声对应的掩码,根据观测信号和与目标声源对应的掩码来计算包含背景噪声的目标声源的空间相关矩阵,根据观测信号和与背景噪声对应的掩码来计算背景噪声的空间相关矩阵,并且根据对各个空间相关矩阵以规定的系数加权后的矩阵来估计目标声源的空间相关矩阵。
- 用于使用声音质量的估计和控制的源分离的装置和方法-201980092879.8
- 克里斯蒂安·乌勒;马特奥·托尔科利;萨沙·迪史克;约尼·鲍卢斯;于尔根·赫勒;奥利弗·赫尔穆特;哈拉尔德·福斯 - 弗劳恩霍夫应用研究促进协会
- 2019-12-20 - 2021-10-29 - G10L21/0308
- 提供了一种用于从音频输入信号生成分离的音频信号的装置。音频输入信号包括目标音频信号部分和残差音频信号部分。残差音频信号部分指示音频输入信号与目标音频信号部分之间的残差。所述装置包括源分离器(110)、确定模块(120)和信号处理器(130)。源分离器(110)被配置为确定取决于音频输入信号的估计的目标信号,估计的目标信号是仅包括目标音频信号部分的信号的估计。确定模块(120)被配置为根据估计的目标信号的估计声音质量确定一个或多个结果值以获得一个或多个参数值,其中一个或多个参数值是一个或多个结果值、或者取决于一个或多个结果值。信号处理器(130)被配置为根据一个或多个参数值、以及根据估计的目标信号和音频输入信号和估计的残差信号中的至少一个来生成分离的音频信号,估计的残差信号是仅包括残差音频信号部分的信号的估计。
- 专利分类