[发明专利]数据处理方法、装置、存储介质和处理器在审
申请号: | 202111510653.0 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114116680A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 曾开新;许贤铭;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/215;G06Q10/06;G06Q40/02 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 赵昀彬 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 处理器 | ||
1.一种数据处理方法,其特征在于,包括:
基于自编码器将第一类型的第一样本数据进行转换,得到所述第一类型的第二样本数据,且基于所述第一样本数据和所述第二样本数据确定目标阈值,其中,所述第二样本数据为所述第一样本数据的重建结果;
基于所述自编码器将第二类型的第三样本数据进行转换,得到所述第二类型的第四样本数据,其中,所述第四样本数据为所述第三样本数据的重建结果;
基于所述目标阈值和所述第四样本数据,在所述第三样本数据中选取第五样本数据;
输出所述第五样本数据,其中,所述第五样本数据用于训练得到目标模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述第一样本数据训练得到所述自编码器。
3.根据权利要求1所述的方法,其特征在于,将第一类型的第一样本数据进行转换,得到所述第一类型的第二样本数据,包括:
基于所述自编码器对所述第一样本数据进行压缩,得到第一压缩结果,且对所述第一压缩结果进行还原,得到所述第二样本数据。
4.根据权利要求1所述的方法,其特征在于,基于所述第一样本数据和所述第二样本数据确定目标阈值,包括:
对所述第一样本数据和所述第二样本数据进行比较,得到第一比较结果;
基于所述第一比较结果确定所述目标阈值。
5.根据权利要求4所述的方法,其特征在于,所述第一样本数据包括多个第一子样本数据,所述第二样本数据包括与所述多个第一子样本数据一一对应的多个第二子样本数据,对所述第一样本数据和所述第二样本数据进行比较,得到第一比较结果,包括:
获取每个所述第一子样本数据和每个所述第二子样本数据之间的第一均方根误差,得到多个第一均方根误差。
6.根据权利要求5所述的方法,其特征在于,基于所述第一比较结果确定所述目标阈值,包括:
对所述多个第一均方根误差进行排序,得到排序结果;
基于所述排序结果确定所述目标阈值。
7.根据权利要求1所述的方法,其特征在于,基于所述自编码器将第二类型的第三样本数据进行转换,得到所述第二类型的第四样本数据,包括:
基于所述自编码器对所述第三样本数据进行压缩,得到第二压缩结果,且对所述第二压缩结果进行还原,得到所述第四样本数据。
8.根据权利要求1所述的方法,其特征在于,基于所述目标阈值和所述第四样本数据,在所述第三样本数据中选取第五样本数据,包括:
对所述第三样本数据和所述第四样本数据进行比较,得到第二比较结果;
基于所述第二比较结果和所述目标阈值,在所述第三样本数据中选取所述第五样本数据。
9.根据权利要求8所述的方法,其特征在于,所述第三样本数据包括多个第三子样本数据,所述第四样本数据包括与所述多个第三子样本数据一一对应的多个第四子样本数据,对所述第三样本数据和所述第四样本数据进行比较,得到第二比较结果,包括:
获取每个所述第三子样本数据和每个所述第四子样本数据之间的第二均方根误差,得到多个第二均方根误差。
10.根据权利要求9所述的方法,其特征在于,基于所述第二比较结果和所述目标阈值,在所述第三样本数据中选取所述第五样本数据,包括:
将所述第三样本数据中,所述第二均方根误差小于等于所述目标阈值的所述第三子样本数据确定为所述第五样本数据。
11.根据权利要求1-10中任意一项所述的方法,其特征在于,所述第一样本数据为处于异常状态的样本数据,和/或,所述第三样本数据为处于异常状态的样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111510653.0/1.html,转载请声明来源钻瓜专利网。