[发明专利]语音信号处理方法、装置及设备在审
| 申请号: | 202010096100.4 | 申请日: | 2020-02-17 |
| 公开(公告)号: | CN111292754A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 王健宗;彭俊清 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L15/14 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;彭程 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 装置 设备 | ||
1.一种语音信号处理方法,其特征在于,包括:
获取待处理语音信号对应的第一统计特征向量,所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数;
将所述第一统计特征向量输入第一模型进行处理,获得第二统计特征向量,所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理;
根据所述第二统计特征向量,确定所述待处理语音信号的目标类别,所述目标类别包括原始语音信号或者录音重放语音信号。
2.如权利要求1所述的方法,其特征在于,所述获取待处理语音信号对应的第一统计特征向量,包括:
将所述待处理语音信号划分为N个语音帧,所述N为大于或者等于1的整数;
获取所述N个语音帧中每个语音帧的第一特征向量,所述第一特征向量用于表示所述语音帧在M维特征空间中每维特征空间的特征值;
针对所述M维特征空间中的每维特征空间,计算该维特征空间对应的统计值,所述统计值为所述N个语音帧在该维特征空间的统计值;
根据所述M维特征空间中每维特征空间对应的统计值,构建所述待处理语音信号对应的第一统计特征向量。
3.如权利要求1或2所述的方法,其特征在于,所述第一统计特征向量包括第一均值向量和/或第一标准差向量,所述第一均值向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的均值,所述第一标准差向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的标准差。
4.如权利要求3所述的方法,其特征在于,若所述第一统计特征向量包括所述第一均值向量和所述第一标准差向量;所述第二统计特征向量包括第二均值向量和第二标准差向量,所述第二均值向量是根据所述第一均值向量和所述第一模型得到,所述第二标准差向量是根据所述第一标准向量和所述第一模型得到;
所述根据所述第二统计特征向量,确定所述待处理语音信号的目标类别,包括:
根据所述第二均值向量和所述第二标准差向量,构建第三统计特征向量;
根据所述第三统计特征向量,确定所述待处理语音信号的目标类别。
5.如权利要求1所述的方法,其特征在于,所述获取待处理语音信号对应的第一统计特征向量之前,还包括:
获取第一样本语音信号对应的第一样本统计特征向量,所述第一样本统计特征向量用于表示所述第一样本语音信号在M维特征空间中每维特征空间的统计值,所述M为大于1的整数,所述第一样本语音信号为录音重放语音信号或者原始语音信号;
将所述第一样本统计特征向量输入所述第一模型进行处理,获得第二样本统计特征向量;
根据所述第二样本统计特征向量,计算所述第一模型的第一损失;
根据所述第一损失,训练所述第一模型。
6.如权利要求5所述的方法,其特征在于,所述获取待处理语音信号对应的第一统计特征向量之前,还包括:
获取第一语音信号,所述第一语音信号为录音重放语音信号;
获取所述第一语音信号的第二特征向量,并将所述第二特征向量输入编码模型进行编码处理,获得第四统计特征向量,所述第四统计特征向量用于表示所述第一语音信号的统计特征;
根据所述第四统计特征向量构建第一隐含向量,并将所述第一隐含向量输入解码模型进行解码处理,获得第三特征向量,其中,由所述第三特征向量生成的第二语音信号与所述第一语音信号之间的相似度满足目标条件;
若所述第一样本语音信号为录音重放语音信号,则所述第一样本语音信号为所述第一语音信号或者所述第二语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010096100.4/1.html,转载请声明来源钻瓜专利网。





