[发明专利]数据处理方法、装置、系统、介质在审
申请号: | 201910519091.2 | 申请日: | 2019-06-14 |
公开(公告)号: | CN112086096A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 仇璐;陈宇;耿岭;元海明;白二伟;郑勇超;刘颖;占凯;刘鲁鹏 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 系统 介质 | ||
本公开提供一种数据处理方法,包括:获取当前语音数据;根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值,所述历史语音数据包括至少一个语音子数据;基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,其中,所述目标语音子数据包括用于控制电子设备失败的语音数据;以及响应于所述历史语音数据包括至少一个目标语音子数据,存储所述至少一个目标语音子数据,以便将所述至少一个目标语音子数据作为训练用于控制所述电子设备的语音模型的样本数据。本公开还提供一种数据处理装置、一种数据处理系统以及一种计算机可读存储介质。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种数据处理方法、一种数据处理装置、一种数据处理系统、以及一种计算机可读存储介质。
背景技术
随着计算机技术发展,电子设备趋向智能化,各种各样的智能设备广泛应用于诸多领域,例如智能家居、智能车辆等得到广泛应用。语音是人类的最常使用的交互方式,所以通过语音唤醒智能设备的技术成为研究热点。现有技术通常通过训练语音模型,并将训练好的语音模型运用于唤醒智能没备,语音模型包括各种各样的神经网络模型。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题,现有技术中语音模型由于样本数据不够丰富,造成语音模型的泛化能力不足,场景适用性不佳,唤醒效果较差。
发明内容
有鉴于此,本公开提供了一种优化的数据处理方法和装置、系统、介质。
本公开的一个方面提供了一种数据处理方法,包括:获取当前语音数据,根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值,所述历史语音数据包括至少一个语音子数据,基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,其中,所述目标语音子数据包括用于控制电子设备失败的语音数据,响应于所述历史语音数据包括至少一个目标语音子数据,存储所述至少一个目标语音子数据,以便将所述至少一个目标语音子数据作为训练用于控制所述电子设备的语音模型的样本数据。
根据本公开实施例,上述方法还包括:确定所述当前语音数据的类别,所述类别包括第一类别和第二类别。所述根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值,包括:响应于确定所述当前语音数据的类别为所述第一类别,根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值。
根据本公开实施例,上述基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,包括:确定所述当前分值与第一阈值之间的分值关系,确定所述历史语音数据中的至少一个语音子数据对应的至少一个第一差值,其中,所述第一差值为第二概率和第一概率之间的差值,所述第一概率为所述至少一个语音子数据属于所述第一类别的概率,所述第二概率为所述至少一个语音子数据属于所述第二类别的概率,基于所述分值关系以及所述至少一个第一差值确定所述历史语音数据是否包括至少一个目标语音子数据。
根据本公开实施例,上述响应于所述历史语音数据包括至少一个目标语音子数据,存储所述至少一个目标语音子数据,包括:在所述分值关系表示所述当前分值大于或等于所述第一阈值并且所述至少一个第一差值中包括满足预设差值的第一差值时,确定所述历史语音数据包括至少一个目标语音子数据,存储所述历史语音数据。
根据本公开实施例,上述基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,包括:获取第二阈值、第三阈值以及分值变量,将所述当前分值与第二阈值、第三阈值以及分值变量进行比较,以获得比较结果,根据所述比较结果确定所述历史语音数据是否包括至少一个目标语音子数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910519091.2/2.html,转载请声明来源钻瓜专利网。