[发明专利]基于隐私保护的语音数据处理方法有效
申请号: | 201911117487.0 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110992957B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 张光林;倪思帆;赵萍 | 申请(专利权)人: | 东华大学 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L21/003;G10L21/007;G06F40/295;G06F18/24;G06N20/00 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 保护 语音 数据处理 方法 | ||
本发明涉及一种基于隐私保护的语音数据处理方法,一个实施例的方法包括:建立语音数据模型,定义了语音数据发布中存在的隐私保护问题,根据语音数据模型定义了语音内容,说话人的声音以及数据集标签这三个方面存在的隐私风险和数据有效性;进一步考虑语音内容和说话人的声音两者之间的相关性,并把它作为一种新的隐私风险;利用机器学习中的分类器来解决由语音内容和说话人的声音的相关性导致的隐私风险问题;利用适当的数据处理方法来分别处理语音内容,说话人的声音以及数据集标签这三部分,实现了隐私风险和数据有效性之间的平衡。本实例能够提高语音数据的隐私保护的安全性,同时保证语音数据的有效性。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种基于隐私保护的语音数据处理方法。
背景技术
在大数据时代,越来越多的语音数据被发布,以用于改善基于语音的服务或学术研究。但在语音数据发布过程中存在着隐私泄露的风险。例如,在语音数据发布中,攻击者如果知道特定用户的语音数据,则可以通过分析语音数据来了解用户的敏感信息。因此,在语音数据发布中,防止攻击者侵犯用户隐私是非常重要的。语音数据包括三个方面:语音内容,说话者的声音以及数据集标签,这三个方面都包含了用户的隐私信息。具体来说,语音内容能够直接反映用户的信息。例如,如果用户在购物软件上的语音数据被泄露,攻击者可以通过分析文本轻松了解用户的职业、偏好、生活习惯等。此外,通过检测说话者的声音,攻击者还可以获得用户的性别、年龄、位置、宗教信仰等隐私信息。最后,数据集标签也包含了隐私信息。假设一个语音数据属于“A学院的男生”这一数据集,那么攻击者将知道用户的性别和学校。现有的研究中有一部分是只考虑了语音数据中说话人声纹的隐私保护问题,是通过利用安全多方计算的方法来保护说话人的声纹。也有研究者试图在实现隐私保护的同时,保证语音数据本身的质量。然而,这些工作都忽略了语音内容与说话人声音的相关性,因此在语音数据发布中并不能完全地保护用户的隐私,因为攻击者仍然可以利用语音内容与说话人声音的相关性来过滤那些经过隐私保护处理的语音数据。
发明内容
本发明的目的是:保证语音数据在发布过程的隐私安全,同时保证语音数据的有效性。
为了达到上述目的,本发明的技术方案是提供了一种基于隐私保护的语音数据处理方法,其特征在于,包括以下步骤:
步骤1、定义语音数据集D=(cate,S),其中,cate是数据集标签;S是语音数据,包括语音内容c和说话人的声音v,语音内容c是语音数据的文本信息,说话人的声音v体现用户的身份信息,说话人的声音v和语音内容c之间存在映射关系,即F:c→v,称F为c和v之间的相关性;
定义语音数据发布中存在的隐私保护问题,对于一条语音数据S,定义隐私泄漏风险的五个指标,分别为文本、语音属性、声纹、成员关系和相关性泄漏风险,分别用Pts,Pm,表示,其中,Pm只与数据集标签cate有关,每条语音数据S的总的隐私泄露风险表示为:其中,fp是求和函数;
定义四个有效性损失指标分别为文本可靠性损失、语音多样性损失、语音质量损失和数据集清晰度损失,分别用Ut,Uvd,Usq,Udc,Uco表示,语音数据集D的总的有效性损失表示为:U=fu(Ut,Uvd,Usq,Udc,Uco),其中,fu是一个求和函数;
步骤2、对语音数据集D的类型描述cate进行处理,成员关系Pm随着处理方式x的不同而变化,表示成Pm=f1(x),同时造成了数据清晰度损失Udc=f2(x);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911117487.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:U形件横梁铆接工艺
- 下一篇:一种遥控抹光机抹刀偏转装置