[发明专利]单信道多说话人身份识别方法及系统有效
申请号: | 201810053962.1 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108417201B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 俞凯;钱彦旻;王帅 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22;G10L17/02;G10L17/04;G10L17/14;G10L17/22;G10L25/30 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种单信道多说话人身份识别方法及系统,所述单信道多说话人身份识别方法包括:获取待识别的关于单信道多说话人的语音数据的混合帧级特征;将混合帧级特征输入至卷积神经网络模型,以由卷积神经网络模型推导关于多说话人各自作为参考目标说话人的帧级别概率分布;根据帧级别概率分布,预测关于多说话人各自作为参考目标说话人的语句级别概率分布;以及基于语句级别概率分布,识别语音数据所对应的说话人身份。本发明实施例的单信道多说话人身份识别方法,以卷积神经网络模型作为学习机器,提高了说话人身份识别的高精确度,并不需要对每种可能的说话人组合都建模,对计算和存储资源的消耗较低,提高了身份识别系统的性能。 | ||
搜索关键词: | 信道 说话 人身 识别 方法 系统 | ||
【主权项】:
1.一种单信道多说话人身份识别方法,所述方法包括:获取待识别的关于单信道多说话人的语音数据的混合帧级特征;将所述混合帧级特征输入至卷积神经网络模型,以由所述卷积神经网络模型推导关于多说话人各自作为参考目标说话人的帧级别概率分布;根据所述帧级别概率分布,预测关于所述多说话人各自作为参考目标说话人的语句级别概率分布;以及基于所述语句级别概率分布,识别所述语音数据所对应的说话人身份。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810053962.1/,转载请声明来源钻瓜专利网。
- 上一篇:语音合成播报方法和装置
- 下一篇:语音识别方法及系统