[发明专利]一种声纹库的生成方法和装置有效
| 申请号: | 202010071212.4 | 申请日: | 2020-01-21 |
| 公开(公告)号: | CN111063360B | 公开(公告)日: | 2022-08-19 |
| 发明(设计)人: | 张晴晴;杨金富;罗磊;刘天宇;鲁旻;马光谦;汪洋 | 申请(专利权)人: | 北京爱数智慧科技有限公司 |
| 主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18 |
| 代理公司: | 北京智沃律师事务所 11620 | 代理人: | 吴志宏 |
| 地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 声纹 生成 方法 装置 | ||
1.一种声纹库的生成方法,其特征在于,包括以下步骤:
获取目标说话人的音频数据库,从所述音频数据库中标注出一个或多个标准音频段,将所述标准音频段保存到声纹库;
提取所述标准音频段的第一声纹特征;
提取所述音频数据库中的候选音频段的第二声纹特征;
计算所述第一声纹特征与所述第二声纹特征之间的相似度;
计算所述候选音频段的离散系数;
根据所述相似度和所述离散系数,计算所述候选音频段的置信度;
在所述置信度大于或等于预设阈值的情况下,将所述候选音频段保存到所述声纹库;
所述计算所述第一声纹特征与所述第二声纹特征之间的相似度,包括:
对所述第一声纹特征与所述第二声纹特征分别计算余弦相似度、概率线性判别,以及计算皮尔森相关系数;
所述根据所述相似度和所述离散系数,计算所述候选音频段的置信度,包括:
结合所述余弦相似度、所述概率线性判别、所述皮尔森相关系数,以及所述离散系数,通过逻辑回归得到所述候选音频段的置信度,所述置信度用于衡量所述第一声纹特征与所述第二声纹特征之间的多维度相似度。
2.如权利要求1所述的方法,其特征在于,所述提取所述音频数据库中的候选音频段的第二声纹特征之前,还包括:
对所述音频数据库中除所述标准音频段之外的其他音频进行分割,得到多个候选音频段。
3.如权利要求1所述的方法,其特征在于,所述获取目标说话人的音频数据库,具体包括:
使用预设信息和所述目标说话人的人名作为搜索条件,爬取网络视频;
从所述网络视频中提取所述目标说话人的音频数据库。
4.如权利要求3所述的方法,其特征在于,所述预设信息为“访谈”和/或“采访”字样。
5.如权利要求1所述的方法,其特征在于,所述计算所述候选音频段的离散系数,包括:
使用预设时长以及预设移动步长的时间窗,将所述候选音频段分割成多个音频片段;
提取每个所述音频片段的声纹特征,根据多个所述音频片段的声纹特征,计算所述候选音频段的离散系数。
6.一种声纹库的生成装置,其特征在于,包括:
获取模块,用于获取目标说话人的音频数据库;
标注模块,用于从所述音频数据库中标注出一个或多个标准音频段,将所述标准音频段保存到声纹库;
第一提取模块,用于提取所述标准音频段的第一声纹特征;
第二提取模块,用于提取所述音频数据库中的候选音频段的第二声纹特征;
第一计算模块,用于计算所述第一声纹特征与所述第二声纹特征之间的相似度;
第二计算模块,用于计算所述候选音频段的离散系数;
第三计算模块,用于根据所述相似度和所述离散系数,计算所述候选音频段的置信度;
保存模块,用于在所述置信度大于或等于预设阈值的情况下,将所述候选音频段保存到所述声纹库;
所述第一计算模块,具体用于对所述第一声纹特征与所述第二声纹特征分别计算余弦相似度、概率线性判别,以及计算皮尔森相关系数;
所述第三计算模块,具体用于结合所述余弦相似度、所述概率线性判别、所述皮尔森相关系数,以及所述离散系数,通过逻辑回归得到所述候选音频段的置信度,所述置信度用于衡量所述第一声纹特征与所述第二声纹特征之间的多维度相似度。
7.如权利要求6所述的装置,其特征在于,还包括:
分割模块,用于对所述音频数据库中除所述标准音频段之外的其他音频进行分割,得到多个候选音频段。
8.如权利要求6所述的装置,其特征在于,
所述获取模块,具体用于使用预设信息和所述目标说话人的人名作为搜索条件,爬取网络视频;从所述网络视频中提取所述目标说话人的音频数据库。
9.如权利要求8所述的装置,其特征在于,所述预设信息为“访谈”和/或“采访”字样。
10.如权利要求6所述的装置,其特征在于,
所述第二计算模块,具体用于使用预设时长以及预设移动步长的时间窗,将所述候选音频段分割成多个音频片段;提取每个所述音频片段的声纹特征,根据多个所述音频片段的声纹特征,计算所述候选音频段的离散系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱数智慧科技有限公司,未经北京爱数智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010071212.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液压打泥装载机
- 下一篇:一种模具钢及其制备方法





