[发明专利]数据处理方法、装置、电子设备及计算机可读存储介质在审

申请号：	202010637131.6	申请日：	2020-07-03
公开（公告）号：	CN113886518A	公开（公告）日：	2022-01-04
发明（设计）人：	王鹏伟;魏亮晨;曹涌;谢静辉;聂再清	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/332;G06F40/30;G06N3/04;G06N3/08
代理公司：	北京智信四方知识产权代理有限公司 11519	代理人：	刘真
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了一种数据处理方法、装置、电子设备及计算机可读存储介质，所述方法包括：获取数字语音数据，其中，所述数字语音数据为无标注数据；基于所述数据语音数据进行双重训练，得到语音数据处理模型；获取待处理语音数据，利用所述语音数据处理模型对于所述待处理语音数据进行处理，得到数据处理结果。该技术方案无需对于语音训练数据进行标注，也无需考虑数据标注所花费的人力成本，因此可大幅度扩充语音训练数据数量，同时结合上述双重训练机制即可得到相对完备的语音数据处理模型，从而在节省数据标注所需的大量人力和财力的情况下，能够有效实现数据的全面覆盖，进而有效提高语音处理准确性，提升语音处理任务性能，有利于推广。

技术领域

本公开实施例涉及数据处理技术领域，具体涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。

背景技术

随着网络科学技术和数据处理技术的发展，人工智能的应用越来越广泛，智能语音助手作为人工智能产品之一，在日常生活中得到普及应用，比如智能手机助手、智能音箱、智能电视、智能车载助手、智能同声翻译等等。现有技术在进行智能语音处理时，通常先将输入的语音信号经过声学模型转换为声音频谱信号、音素、字、字片段、拼音等语音中间结果，再将得到的语音中间结果应用到不同的下游语音处理任务中，比如语音识别(ASR)，端到端口语理解(E2E SLU)、语音增强、语音唤醒、端到端语音转译、声纹识别等等。但是，现有技术中为了得到良好的泛化性能，需要大量的语音训练数据，而且还需要对于大量的语音训练数据进行标注，而语音训练数据的标注不仅会耗费大量的人力和财力，而且也无法实现实际应用中数据的全面覆盖，进而导致语音处理准确性低下，使得语音处理任务性能受损，不利于推广。

发明内容

本公开实施例提供一种数据处理方法、装置、电子设备及计算机可读存储介质。

第一方面，本公开实施例中提供了一种数据处理方法。

具体的，所述数据处理方法，包括：

获取数字语音数据，其中，所述数字语音数据为无标注数据；

基于所述数据语音数据进行双重训练，得到语音数据处理模型；

获取待处理语音数据，利用所述语音数据处理模型对于所述待处理语音数据进行处理，得到数据处理结果。

结合第一方面，本公开实施例在第一方面的第一种实现方式中，所述获取数字语音数据，包括：

接收模拟语音数据；

对于所述模拟语音数据进行数字化语音处理，得到所述数字语音数据。

结合第一方面和第一方面的第一种实现方式，本公开实施例在第一方面的第二种实现方式中，所述获取数字语音数据之后，还包括：

展示所述数字语音数据。