[发明专利]混叠音处理方法、装置和存储介质在审
| 申请号: | 202210681168.8 | 申请日: | 2022-06-16 |
| 公开(公告)号: | CN114882914A | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 蔡志平 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/30 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘剑波 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 混叠音 处理 方法 装置 存储 介质 | ||
1.一种混叠音处理方法,包括:
将待识别语音进行分割,以得到多个语音片段;
根据每个语音片段的声纹特征对所述多个语音片段进行聚类,以得到多个聚类集合;
统计每个聚类集合中的时长大于第一时长门限的语音片段的个数,按照所述个数从大到小的顺序选择前两个聚类集合作为第一聚类集合和第二聚类集合;
将所述第一聚类集合中不存在混叠音的语音片段加入第一语音集合,将所述第一聚类集合中存在混叠音的语音片段加入混叠音集合;
将所述第二聚类集合中不存在混叠音的语音片段加入第二语音集合,将所述第二聚类集合中的存在混叠音的语音片段加入所述混叠音集合;
利用所述第一语音集合中的第一语音片段生成第一掩膜,利用所述第二语音集合中的第二语音片段生成第二掩膜;
利用所述第一掩膜和所述第二掩膜将所述混叠音集合中的每个语音片段进行混叠音分离。
2.根据权利要求1所述的方法,其中,所述对所述多个语音片段进行聚类包括:
利用经过训练的机器学习模型获取所述多个语音片段中的每个语音片段的声纹特征;
根据所述声纹特征将所述多个语音片段进行聚类,以得到所述多个聚类集合。
3.根据权利要求2所述的方法,其中,所述获取所述多个语音片段中的每个语音片段的声纹特征包括:
利用移动窗提取所述多个语音片段中的第i个语音片段中的多个子声纹特征,其中所述移动窗的移动步长小于所述移动窗的长度,1≤i≤I,I为语音片段总数;
根据所述多个子声纹特征确定所述第i个语音片段的声纹特征。
4.根据权利要求3所述的方法,其中,所述根据所述多个子声纹特征确定所述第i个语音片段的声纹特征包括:
计算所述多个子声纹特征的加权平均值,以作为所述第i个语音片段的声纹特征。
5.根据权利要求3所述的方法,其中,
所述移动窗的移动步长为所述移动窗的长度的1/2。
6.根据权利要求1所述的方法,其中,
所述第一语音片段的时长和第二语音片段的时长均大于第二时长门限。
7.根据权利要求3所述的方法,其中,将所述第一聚类集合中不存在混叠音的语音片段加入第一语音集合,将所述第一聚类集合中存在混叠音的语音片段加入混叠音集合包括:
计算所述第一聚类集合中的第j个语音片段的声纹特征与所述第二聚类集合的聚类质心向量的第一质心相似度,1≤j≤J,J为所述第一聚类集合中的语音片段总数;
计算所述第j个语音片段的每个子声纹特征与所述第二聚类集合的聚类质心向量的第二质心相似度,以得到第一相似度序列;
在所述第一相似度序列中,统计连续满足第一预设条件的第二质心相似度的个数,其中所述第一预设条件为第二质心相似度与第一质心相似度的比值不小于预设门限;
若连续满足预设条件的第二质心相似度的个数大于个数门限,则将对应的移动窗标记为混叠音窗,记录混叠音窗的起止位置,并将所述第j个语音片段加入混叠音集合,否则将所述第j个语音片段加入第一语音集合。
8.根据权利要求3所述的方法,其中,所述将所述第二聚类集合中不存在混叠音的语音片段加入第二语音集合,将所述第二聚类集合中的存在混叠音的语音片段加入所述混叠音集合包括:
计算所述第二聚类集合中的第k个语音片段的声纹特征与所述第一聚类集合的聚类质心向量的第三质心相似度,1≤k≤K,K为所述第二聚类集合中的语音片段总数;
计算所述第k个语音片段的每个子声纹特征与所述第一聚类集合的聚类质心向量的第四质心相似度,以得到第二相似度序列;
在所述第二相似度序列中,统计连续满足第二预设条件的第四质心相似度的个数,其中所述第二预设条件为第四质心相似度与第三质心相似度的比值不小于预设门限;
若连续满足预设条件的第四质心相似度的个数大于个数门限,则将对应的移动窗标记为混叠音窗,记录混叠音窗的起止位置,并将所述第k个语音片段加入混叠音集合,否则将所述第k个语音片段加入第二语音集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210681168.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:连接器以及电子设备
- 下一篇:半导体结构的制作方法及半导体结构





