[发明专利]掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法有效
申请号: | 201880047142.X | 申请日: | 2018-07-18 |
公开(公告)号: | CN110914899B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | M·德尔克鲁瓦;木下庆介;小川厚德;樋口卓哉;中谷智广 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G10L21/0308 | 分类号: | G10L21/0308;G10L21/0272 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 金玲;崔成哲 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 装置 权重 学习 神经网络 计算方法 学习方法 | ||
簇权重计算部(322)根据特定讲话者的语音的信号,使用簇权重计算NN来计算至少任意一个层被分解为多个簇的掩模计算NN的与多个簇各自对应的权重。掩模计算部(302)根据1个以上的讲话者的语音的观测信号的特征量,使用通过由簇权重计算部(322)计算出的权重进行加权后的掩模计算NN来计算从1个以上的讲话者的语音的观测信号的特征量中提取特定讲话者的语音的特征量的掩模。
技术领域
本发明涉及掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法。
背景技术
有时在录制讲话者的语音时,会与讲话者的语音同时录制周围的噪声。在这样的情况下,难以从所录制的语音中仅听取讲话者的语音。与此相对,以往,已知有从包含噪声的语音的语音数据中取出目标的讲话者的语音的技术(例如,参照非专利文献1或非专利文献2)。
例如,在非专利文献1中记载了如下技术:计算用于从观测信号中提取增强地表示目标讲话者的语音的信号的时间频率点中的信号的掩模。此外,例如,非专利文献2中记载了使用神经网络进行掩模的计算的技术。
现有技术文献
非专利文献
非专利文献1:Y Wang,A Narayanan,DL Wang,“On training targets forsupervised speech separation”,IEEE/ACM Transactions on Audio,Speech andLanguage processing,2014
非专利文献2:J Heymann,L Drude,R Haeb-Umbach,“Neural network basedspectral mask estimation for acoustic beamforming”,Acoustics,Speech andSignal Processing(ICASSP),2016
发明内容
发明所要解决的课题
但是,在现有的技术中存在如下问题:在所观测的语音中包含多个讲话者的语音的情况下,难以取出目标的讲话者的语音。例如,在现有的技术中,假设将除了目标的讲话者的语音以外的语音视作噪声,在讲话者的语音和噪声中,特征不同。另一方面,在所观测的语音中包含多个讲话者的语音的情况下,各讲话者的语音的特征相似,因此,在现有的技术中,由于无法识别除了目标的讲话者以外的讲话者的语音,所以难以仅取出目标的讲话者的语音。
用于解决问题的手段
本发明的掩模计算装置的特征在于,具有:特征量提取部,其从语音的观测信号中提取特征量,该语音包含至少1个以上的讲话者的语音,该1个以上的讲话者包含目标讲话者;掩模计算部,其根据所述观测信号的特征量和适应用目标讲话者信号,计算从所述观测信号中提取目标讲话者的语音的掩模,该适应用目标讲话者信号是所述目标讲话者的语音的信号;以及目标信号计算部,其基于所述掩模,根据所述观测信号计算所述目标讲话者的语音的信号。
本发明的簇权重学习装置的特征在于,具有:簇权重计算部,其根据特定讲话者的语音的信号,使用第2神经网络来计算至少任意一个层被分解为多个簇的第1神经网络的与所述多个簇各自对应的权重;掩模计算部,其根据所述1个以上的讲话者的语音的观测信号的特征量,使用通过所述簇权重计算部所计算出的权重进行加权后的所述第1神经网络来计算掩模,该掩模从包含所述特定讲话者的1个以上的讲话者的语音的观测信号的特征量中提取所述特定讲话者的语音的特征量;簇权重微分值计算部,其通过将所述第1神经网络和所述第2神经网络视作结合的神经网络,对该结合的神经网络进行误差反向传播,计算所述权重的微分值;以及簇权重更新部,其根据由所述簇权重微分值计算部计算出的所述簇权重的微分值,对所述簇权重进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880047142.X/2.html,转载请声明来源钻瓜专利网。