[发明专利]语音特征信息提取方法、终端及可读存储介质在审
| 申请号: | 201911099179.X | 申请日: | 2019-11-11 |
| 公开(公告)号: | CN110827853A | 公开(公告)日: | 2020-02-21 |
| 发明(设计)人: | 陈昊亮;许敏强;杨世清 | 申请(专利权)人: | 广州国音智能科技有限公司 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
| 地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 特征 信息 提取 方法 终端 可读 存储 介质 | ||
本申请公开了一种语音特征信息提取方法、终端和计算机可读存储介质,通过获取发言人目标语音数据,得到目标语音片段;获取发言人基准语音数据;比对各所述目标语音片段和所述基准语音数据,获得比对结果;基于所述比对结果,生成并提取各所述目标语音片段中的发言人语音特征信息,实现语音特征信息的提取,由此可以在多个发言人情境下,将所有发言人的语音特征信息区分并提取出来。
技术领域
本申请涉及语音信号处理技术领域,尤其涉及一种语音特征信息提取方法、终端及可读存储介质。
背景技术
目前,在多个说话人场景中,通常会出现不同说话人语音混叠的情况,目前针对混合语音中目标说话人的语音提取研究越来越受到重视。语音提取方法主要为层次聚类和谱聚类等,如层次聚类有:提取语音段的梅尔倒谱系数(MFCC)特征,之后训练部分使用贝叶斯信息准则(BIC)对初始类进行处理,获得较纯的初始类别,之后采用聚类算法对于MFCC特征进行聚类,并对每一类训练获得GMM模型特征,在识别阶段,使用基于GMM模型的说话人识别进行说话人判断;然而层次聚类在进行无监督的说话人聚类识别时,以最小类间距是否大于一定的阈值作为判定聚类结束的标准,阈值的确定限制了层次聚类算法的效果。由此可见,目前语音特征信息提取方法自适应能力低。
发明内容
本申请的主要目的在于提供一种语音特征信息提取方法、终端及计算机存储介质,旨在解决现有技术中多个发言人信息提取精度低的技术问题。
为实现上述目的,本申请实施例提供一种语音特征信息提取方法,所述语音特征信息提取方法包括以下步骤:
获取发言人目标语音数据,得到目标语音片段;
获取发言人基准语音数据;
比对各所述目标语音片段和所述基准语音数据,获得比对结果;
基于所述比对结果,生成并提取各所述目标语音片段中的发言人语音特征信息。
可选地,所述获取发言人目标语音数据的步骤包括:
接收待提取的各所述发言人的原始语音数据;
对所述原始语音数据进行信号预处理,得到各所述发言人的目标语音数据。
可选地,所述得到目标语音片段的步骤包括:
基于预设关键字和预设语气词,对所述目标语音数据进行语义识别,获得识别结果;
基于所述识别结果,获得所述目标语音片段。
可选地,所述对所述语音数据进行信号预处理,得到各所述发言人的目标语音数据的步骤包括:
检测所述语音数据,根据声音频率区分出所述语音数据中的噪声;
对所述语音数据进行去除噪声处理,得到各所述发言人的目标语音数据。
可选地,所述获取发言人基准语音数据的步骤包括:
通过声纹识别,获取所述发言人个数;
基于所述发言人个数,输出语音录制通知,其中,所述通知为要求各所述发言人按照预设语音录制模型进行语音录制;
接收各所述发言人按照所述通知录入的语音录制结果,作为各所述发言人的基准语音数据。
可选地,所述比对各所述目标语音片段和所述基准语音数据,获得比对结果的步骤包括:
比对各所述目标语音片段和所述基准语音数据,得到各所述目标语音片段和所述基准语音数据的欧式距离;
基于所述欧式距离,获得所述比对结果。
可选地,所述基于所述比对结果,生成并提取各所述目标语音片段中的发言人语音特征信息的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911099179.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





