[发明专利]一种基于自监督学习的语音鉴伪方法、装置及存储介质有效
申请号: | 202211701458.0 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115662441B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 郑榕;孟凡芹 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L19/24;G10L21/0332 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 语音 方法 装置 存储 介质 | ||
本申请提供了一种基于自监督学习的语音鉴伪方法、装置及存储介质,语音鉴伪方法包括:将待鉴伪语音输入至语音鉴伪模型的波形增强网络层之中,对待鉴伪语音进行波形增强处理,确定出波形增强后的待鉴伪语音;将波形增强后的待鉴伪语音输入至语音鉴伪模型的自监督学习前端网络层之中,确定出波形增强后的待鉴伪语音的每一语音片段的语音特征向量;将该语音片段的多个语音特征向量输入至语音鉴伪模型的自监督学习处理网络层之中,确定出该语音片段的目标特征向量;将多个目标特征向量输入至语音鉴伪模型的鉴伪网络层之中,进行鉴伪处理,确定出待鉴伪语音是否为虚假语音。实现了为鉴伪网络层提供了有效语音表征信息,从而提高了语音鉴伪的准确率。
技术领域
本申请涉及语音检测技术领域,尤其是涉及一种基于自监督学习的语音鉴伪方法、装置及存储介质。
背景技术
深度学习从大量数据中自动学习的能力使其在各种领域广泛应用,但是传统的监督学习模型极度依赖于大量的有标签数据。所以自监督学习的到了广泛关注,因为它可以从数据自己本身中寻找伪标签来监督模型的训练。监督学习不仅需要大量的标注数据,它还面临着下面的各种问题,包括模型的泛化性能问题、监督训练数据相关性不高、对抗攻击等。当面对语音鉴伪的复杂多样的实际应用环境时会导致语音鉴伪的准确率低。所以,如何提高语音鉴伪的准确率成为了不容小觑的技术问题。
发明内容
有鉴于此,本申请的目的在于提供一种基于自监督学习的语音鉴伪方法、装置及存储介质,通过对鉴伪语音的波形进行增强处理以及对自监督学习前端网络层之中各层变形器编码单元的语音特征向量进行叠加处理,得到叠加后的语音特征向量,为鉴伪网络层提供了有效语音表征信息,从而提高了语音鉴伪的准确率。
本申请实施例提供了一种基于自监督学习的语音鉴伪方法,所述语音鉴伪方法包括:
获取待鉴伪语音;
将所述待鉴伪语音输入至预先训练好的语音鉴伪模型的波形增强网络层之中,对所述待鉴伪语音进行波形增强处理,确定出波形增强后的待鉴伪语音;
将所述波形增强后的待鉴伪语音输入至所述语音鉴伪模型的自监督学习前端网络层之中,确定出所述波形增强后的待鉴伪语音的每一语音片段在所述自监督学习前端网络层之中各层变形器编码单元的语音特征向量;
针对于每个语音片段的多个语音特征向量,将该语音片段的多个所述语音特征向量输入至所述语音鉴伪模型的自监督学习处理网络层之中,对多个语音特征向量进行叠加处理,得到叠加后的语音特征向量,对所述叠加后的语音特征向量进行特征处理,确定出该语音片段的目标特征向量;
将多个所述目标特征向量输入至所述语音鉴伪模型的鉴伪网络层之中,进行鉴伪处理,确定出所述待鉴伪语音是否为虚假语音。
在一种可能的实施方式中,所述将所述待鉴伪语音输入至预先训练好的语音鉴伪模型的波形增强网络层之中,对所述待鉴伪语音进行波形增强处理,确定出波形增强后的待鉴伪语音,包括:
对所述待鉴伪语音进行语音格式的转换,确定出所述波形增强后的待鉴伪语音;或者,
基于高档码率、中档码率以及低档码率中的任意一种码率对所述待鉴伪语音进行波形增强处理,确定出所述波形增强后的待鉴伪语音;或者,
基于宽带编码译码器或窄带编码译码器对所述待鉴伪语音进行波形增强处理,确定出所述波形增强后的待鉴伪语音。
在一种可能的实施方式中,所述自监督学习前端网络层还包括多层卷积编码单元,所述将所述波形增强后的待鉴伪语音输入至所述语音鉴伪模型的自监督学习前端网络层之中,确定出所述波形增强后的待鉴伪语音的每一语音片段在所述自监督学习前端网络层之中各层变形器编码单元的语音特征向量,包括:
对所述波形增强后的待鉴伪语音进行语音分段处理,确定出多个所述语音片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211701458.0/2.html,转载请声明来源钻瓜专利网。