[发明专利]一种语音数据处理方法、装置及设备在审
申请号: | 202110319220.0 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113066485A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 刘杰;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L19/16 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 数据处理 方法 装置 设备 | ||
本公开实施例提供了一种语音数据处理方法、装置及设备,包括:获取待处理的原始语音数据;将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据,其中,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到;输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值。
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音数据处理方法、装置及设备。
背景技术
语音作为人类语言和思想的记录方式,往往蕴涵着重要的个人信息。例如,企业内部电话会议往往会包含公司的一些机密内容,个人的私密通话或者语音聊天偶尔也包含重要的个人资产信息、账号密码、个人姓名、手机号码、地址等敏感信息。
随着人工智能技术的快速发展,语音识别技术很容易识别语音并转成文本,然而,这也给个人隐私带来了严重的威胁。语音识别技术可以轻易将个人的信息从语音文件或者通话中识别并解析出来,并且能够准确的识别个人的姓名,手机号,地址,公司等信息。因此,需要提供一种能够有效防止利用语音识别技术识别语音内容的技术方案。
发明内容
本公开实施例的目的是提供一种语音数据处理方法、装置及设备,以提供一种能够有效防止非法利用语音识别技术识别语音内容的技术方案。
为了解决上述技术问题,本说明书实施例是这样实现的:
第一方面,本公开实施例提供了一种语音数据处理方法,包括:获取待处理的原始语音数据。将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据,其中,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到。输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值。
第二方面,本公开实施例提供了一种语音数据处理方法,包括:接收终端设备发送的预设语音编码模型获取请求。将预设语音编码模型发送至终端设备,以使终端设备基于获取的预设语音编码模型,获取待处理的原始语音数据,将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据,输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到。
第三方面,本公开实施例提供了一种语音数据处理装置,包括:第一获取模块,获取待处理的原始语音数据。第一输入模块,将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据。数据输出模块,输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到。
第四方面,本公开实施例提供了一种语音数据处理装置,包括:第二接收模块,接收终端设备发送的预设语音编码模型获取请求。第二发送模块,将预设语音编码模型发送至终端设备,以使终端设备基于获取的预设语音编码模型,获取待处理的原始语音数据,将原始语音数据输入至预设语音编码模型中,以对原始语音数据进行语音编码处理,得到目标语音数据,输出目标语音数据,其中,目标语音数据与原始语音数据的相似度大于第一预设阈值,将原始语音数据和目标语音数据分别输入至语音识别模型后输出的第一识别结果与第二识别结果的相似度小于第二预设阈值,预设语音编码模型是基于预先获取的样本语音数据,以及预先训练的语音识别模型进行训练而得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110319220.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路桥梁挡风屏
- 下一篇:一种高效热浸镀锌的装置