[发明专利]用户识别方法、装置、设备及存储介质在审
申请号: | 202110038063.6 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112784888A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 沈易栋;万高峰;刘清;刘阳;刘子龙 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 设备 存储 介质 | ||
1.一种用户识别模型的训练方法,其特征在于,所述方法包括:
获取用户特征样本集,其中,所述用户特征样本集包括多个正样本和多个负样本,且所述用户特征样本集中的正样本的数量小于负样本的数量;
根据所述用户特征样本集获取至少一个子样本集,其中,所述子样本集包括所述用户特征样本集中的全部正样本,以及部分负样本,且所述子样本集中的正样本的数量大于或等于负样本的数量;
根据所述至少一个子样本集分别训练至少一个预设的代价敏感分类器,得到至少一个目标分类器;
集成所述至少一个目标分类器,得到用户识别模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户特征样本集获取至少一个子样本集,包括:
对所述用户特征样本集中的负样本进行随机抽样,得到所述部分负样本;
组合所述部分负样本与所述全部正样本,得到所述子样本集。
3.根据权利要求1所述的方法,其特征在于,所述代价敏感分类器的惩罚系数包括正样本惩罚系数和负样本惩罚系数,且所述负样本惩罚系数与所述正样本惩罚系数的比值等于所述代价敏感分类器对应的子样本集中的负样本与正样本的数量的比值。
4.根据权利要求1-3任意一项所述的方法,其特征在于,每两个子样本集中的负样本的数量相同。
5.根据权利要求1-3任意一项所述的方法,其特征在于,所述代价敏感分类器包括Adaboost分类器或者代价敏感决策树分类器,所述Adaboost分类器中的弱分类器为代价敏感支持向量机CS-SVM。
6.一种用户识别方法,其特征在于,所述方法包括:
获取目标用户的用户特征;
基于用户识别模型对所述用户特征进行识别,得到目标用户的识别结果,其中,所述识别结果包括目标用户正常或者目标用户异常,所述用户识别模型基于权利要求1-5任意一项所述的用户识别模型的训练方法得到。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取检验结果,其中,所述检验结果表征所述识别结果是否与目标用户对应的标注结果一致;
在所述识别结果与所述标注结果不一致的情况下,将所述用户特征更新至所述用户识别模型对应的用户特征样本集;
根据更新后的用户特征样本集训练所述用户识别模型。
8.一种用户识别模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取用户特征样本集,其中,所述用户特征样本集包括多个正样本和多个负样本,且所述用户特征样本集中的正样本的数量小于负样本的数量;
所述获取模块,还用于根据所述用户特征样本集获取至少一个子样本集,其中,所述子样本集包括所述用户特征样本集中的全部正样本,以及部分负样本,且所述子样本集中的正样本的数量大于或等于负样本的数量;
训练模块,用于根据所述至少一个子样本集分别训练至少一个预设的代价敏感分类器,得到至少一个目标分类器;
集成模块,用于集成所述至少一个目标分类器,得到用户识别模型。
9.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
抽取单元,用于对所述用户特征样本集中的负样本进行随机抽样,得到所述部分负样本;
组合单元,用于组合所述部分负样本与所述全部正样本,得到所述子样本集。
10.根据权利要求8所述的装置,其特征在于,所述代价敏感分类器的惩罚系数包括正样本惩罚系数和负样本惩罚系数,所述负样本惩罚系数与所述正样本惩罚系数的比值等于所述代价敏感分类器对应的子样本集中的负样本与正样本的数量的比值。
11.根据权利要求8-10任意一项所述的装置,其特征在于,每两个子样本集中的负样本的数量相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110038063.6/1.html,转载请声明来源钻瓜专利网。