[发明专利]数据类型的识别、模型训练、风险识别方法、装置及设备有效
申请号: | 201710458652.3 | 申请日: | 2017-06-16 |
公开(公告)号: | CN107391569B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 程羽 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/35;G06K9/62;G06Q10/06 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据类型 识别 模型 训练 风险 方法 装置 设备 | ||
1.一种数据类型的识别方法,用于识别数据为第一类数据或第二类数据,所述方法包括:
获取待识别数据,利用预设的异常检测模型检测所述待识别数据是否为第一类数据;
将异常检测模型识别出的第一类数据之外的其他数据输入到分类模型进行识别,该分类模型将所述其它数据分类为第一类数据和第二类数据;用于训练所述异常检测模型的第一样本数据集中第一类数据的数量大于第二类数据的数量;
其中,所述第一类数据为安全数据,所述第一类数据之外的其他数据为异常数据,所述第二类数据为风险数据,所述分类模型预先利用所述异常检测模型识别出的异常样本数据集训练得到。
2.根据权利要求1所述的方法,所述异常检测模型通过如下方式预先训练得到:
获取第一样本数据集,所述第一样本数据集中第一类数据的数量大于第二类数据的数量;
利用所述第一样本数据集对异常检测模型进行训练。
3.根据权利要求2所述的方法,所述分类模型通过如下方式预先训练得到:
通过所述异常检测模型从第二样本数据集中检测出异常样本数据集;
利用所述异常样本数据集对所述分类模型进行训练。
4.根据权利要求1所述的方法,在利用所述异常样本数据集对所述分类模型进行训练前,所述方法还包括:
基于特征优化算法优化所述异常样本数据集。
5.一种模型训练方法,用于训练异常检测模型和分类模型;
所述异常检测模型用于检测出第一类数据;
所述分类模型用于对异常检测模型检测出的第一类数据之外的其他数据进行分类;
所述方法包括:
通过如下方式训练所述异常检测模型:获取第一样本数据集,所述第一样本数据集中第一类数据的数量大于第二类数据;利用所述第一样本数据集对异常检测模型进行训练;
通过如下方式训练所述分类模型:通过所述异常检测模型从第二样本数据集中检测出异常样本数据集;利用所述异常样本数据集对分类模型进行训练;
其中,所述第一类数据为安全数据,所述第一类数据之外的其他数据为异常数据,所述第二类数据为风险数据。
6.根据权利要求5所述的方法,在利用所述异常样本数据集对分类模型进行训练前,所述方法还包括:
基于特征优化算法优化所述异常样本数据集。
7.一种数据类型的识别装置,用于识别数据为第一类数据或第二类数据,所述装置包括:
数据获取模块,用于:获取待识别数据,利用预设的异常检测模型检测所述待识别数据是否为第一类数据;
类型确定模块,用于:将异常检测模型识别出的第一类数据之外的其他数据输入到分类模型进行识别,该分类模型将所述其它数据分类为第一类数据和第二类数据;用于训练所述异常检测模型的第一样本数据集中第一类数据的数量大于第二类数据的数量;
其中,所述第一类数据为安全数据,所述第一类数据之外的其他数据为异常数据,所述第二类数据为风险数据,所述分类模型预先利用所述异常检测模型识别出的异常样本数据集训练得到。
8.根据权利要求7所述的装置,还包括异常检测模型训练模块,用于:获取第一样本数据集,所述第一样本数据集中第一类数据的数量大于第二类数据的数量;利用所述第一样本数据集对异常检测模型进行训练。
9.根据权利要求8所述的装置,还包括分类模型训练模块,用于:通过所述异常检测模型从第二样本数据集中检测出异常样本数据集;利用所述异常样本数据集对所述分类模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710458652.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:突破跨域请求限制的方法及其系统
- 下一篇:一种移动终端上的题目搜索方法及装置