[发明专利]面向语音通信的身份信息隐藏方法有效
申请号: | 201810120029.1 | 申请日: | 2018-02-06 |
公开(公告)号: | CN108510995B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 简志华;张石磊 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L21/013;G10L25/24 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 语音 通信 身份 信息 隐藏 方法 | ||
本发明公开了一种面向语音通信的身份信息隐藏方法,其按如下步骤进行:一、语音源建模;二、生成语音字典;三、采用身份信息隐藏算法将用户的语音转换成了与该用户差异最大的语音源的声音。通过建立N个说话人的语音库,并提取特征参数储存的方式,解决传统语音转换方法中需要对不同说话人建立不同转换函数的弊端。在本发明中,对于不同的用户,只需要少量语音数据就可以根据相似度选择转换函数,而不再需要重新训练转换函数即可实现身份信息隐藏,方便用户使用。
技术领域
本发明属于信息安全技术领域,具体涉及一种面向语音通信的身份信息隐藏方法。
背景技术
说话人身份隐藏技术是指保持语言语义信息不变的情况下,改变说话人的个性特征,达到隐藏说话人身份的目的,在保密通信领域具有非常重要的应用。目前,在说话人身份隐藏技术中,常用的方法是通过改变语音的基频,达到变声的效果,但是这种方法语音的听觉质量较差。此外还有一种是通过语音转换技术,实现基频和声道谱同时转换,合成具有更高质量的语音,但是这种方式,需要获取大量源、目标说话人的对称语音数据(即语义内容相同的语音),建立语音的转换函数,不同的说话人需要建立不同的转换函数。在使用过程中,用户需要录制较多的语音数据,费时费力,在实际应用中使用不方便。
发明内容
针对现有技术存在的上述问题,本发明提出了一种面向语音通信的身份信息隐藏方法,其通过建立预训练的语音转换函数库,可以便捷、实时地进行说话人身份隐藏。
为达到上述技术目的,本发明采取如下技术方案:
一种面向语音通信的身份信息隐藏方法,其按如下步骤进行:
一、说话人即语音源建模
具体的,利用GMM对每个说话人即语音源的语音特征参数空间进行建模,它是用多个高斯分布的概率密度的组合来描述特征矢量在概率空间的分布状况,每个人对应一个GMM,即
其中,x为d维特征矢量;ωm为混合权重,且满足为d维高斯函数,表示GMM模型的第m个高斯分量;μm表示该高斯分量的均值矢量;∑m表示协方差矩阵。整个高斯混合模型(GMM)由各混合分量的均值矢量、协方差矩阵以及混合权重来描述,用λ来表示该模型,有:
λ={ωm,μm,∑m},m=1,2,...,M (3)
模型参数λ是通过期望最大(Expectation Maximization,EM)算法求得,假设语音特征参数空间是长度为T的矢量序列X={xt,t=1,2,...,T},则有:
通过上述EM算法求解GMM模型参数,为每个说话人分别构建一个GMM模型。
二、生成语音字典
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810120029.1/2.html,转载请声明来源钻瓜专利网。