[发明专利]数据处理方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 202010637131.6 | 申请日: | 2020-07-03 |
| 公开(公告)号: | CN113886518A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 王鹏伟;魏亮晨;曹涌;谢静辉;聂再清 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 刘真 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本公开实施例公开了一种数据处理方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取数字语音数据,其中,所述数字语音数据为无标注数据;基于所述数据语音数据进行双重训练,得到语音数据处理模型;获取待处理语音数据,利用所述语音数据处理模型对于所述待处理语音数据进行处理,得到数据处理结果。该技术方案无需对于语音训练数据进行标注,也无需考虑数据标注所花费的人力成本,因此可大幅度扩充语音训练数据数量,同时结合上述双重训练机制即可得到相对完备的语音数据处理模型,从而在节省数据标注所需的大量人力和财力的情况下,能够有效实现数据的全面覆盖,进而有效提高语音处理准确性,提升语音处理任务性能,有利于推广。
技术领域
本公开实施例涉及数据处理技术领域,具体涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。
背景技术
随着网络科学技术和数据处理技术的发展,人工智能的应用越来越广泛,智能语音助手作为人工智能产品之一,在日常生活中得到普及应用,比如智能手机助手、智能音箱、智能电视、智能车载助手、智能同声翻译等等。现有技术在进行智能语音处理时,通常先将输入的语音信号经过声学模型转换为声音频谱信号、音素、字、字片段、拼音等语音中间结果,再将得到的语音中间结果应用到不同的下游语音处理任务中,比如语音识别(ASR),端到端口语理解(E2E SLU)、语音增强、语音唤醒、端到端语音转译、声纹识别等等。但是,现有技术中为了得到良好的泛化性能,需要大量的语音训练数据,而且还需要对于大量的语音训练数据进行标注,而语音训练数据的标注不仅会耗费大量的人力和财力,而且也无法实现实际应用中数据的全面覆盖,进而导致语音处理准确性低下,使得语音处理任务性能受损,不利于推广。
发明内容
本公开实施例提供一种数据处理方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种数据处理方法。
具体的,所述数据处理方法,包括:
获取数字语音数据,其中,所述数字语音数据为无标注数据;
基于所述数据语音数据进行双重训练,得到语音数据处理模型;
获取待处理语音数据,利用所述语音数据处理模型对于所述待处理语音数据进行处理,得到数据处理结果。
结合第一方面,本公开实施例在第一方面的第一种实现方式中,所述获取数字语音数据,包括:
接收模拟语音数据;
对于所述模拟语音数据进行数字化语音处理,得到所述数字语音数据。
结合第一方面和第一方面的第一种实现方式,本公开实施例在第一方面的第二种实现方式中,所述获取数字语音数据之后,还包括:
展示所述数字语音数据。
结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述基于所述数据语音数据进行双重训练,得到语音数据处理模型,包括:
基于所述数字语音数据训练得到预训练模型;
基于所述数字语音数据和预训练模型训练得到所述语音数据处理模型。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,所述基于所述数字语音数据训练得到预训练模型,被实施为:
确定预训练初始模型,将所述数字语音数据作为输入对于所述预训练初始模型进行训练,得到预训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010637131.6/2.html,转载请声明来源钻瓜专利网。





