[发明专利]语音增强方法、语音识别方法、说话人识别方法和系统有效
申请号: | 202310238080.3 | 申请日: | 2023-03-14 |
公开(公告)号: | CN116092501B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 柯登峰;聂帅;刘文举;梁山;罗琪;胡睿欣;姚文翰;舒文涛;王运峰 | 申请(专利权)人: | 深圳市玮欧科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/14;G10L17/18;G10L21/0232;G10L21/0264 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 姜有保 |
地址: | 518081 广东省深圳市盐田区海山街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音识别技术领域,具体公开了一种语音增强方法、语音识别方法、说话人识别方法和系统,包括基于纯净语音、纯净噪声和散射噪声生成双麦远场带噪语音;基于纯净语音生成多个目标语音,并记录多个目标语音方位;将空间方位均匀地划分为若干个目标区域;基于若干个目标区域对多个目标语音方位进行标签化,获得标签化目标语音方位;从标签化目标语音方位提取双麦远场带噪语音的特征,以获得每个目标区域的特征;构建掩蔽神经语音增强模型;基于每个目标区域的特征、目标语音以及标签化目标语音方位训练掩蔽神经语音增强模型,基于训练好的掩蔽神经语音增强模型增强语音信号;该方法对目标语音方向进行选择性关注,实现语音增强。 | ||
搜索关键词: | 语音 增强 方法 识别 说话 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市玮欧科技有限公司,未经深圳市玮欧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310238080.3/,转载请声明来源钻瓜专利网。