[发明专利]行为数据分类处理方法、装置、设备及存储介质在审
申请号: | 202111506939.1 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114169451A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 兰珣 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/906 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李阳;臧建明 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为 数据 分类 处理 方法 装置 设备 存储 介质 | ||
本申请提供一种行为数据分类处理方法、装置、设备及存储介质,涉及数据处理技术领域,该方法包括:接收第一客户端发送的用户行为数据,并根据所述用户行为数据确定目标数据;将所述目标数据输入训练好的随机森林模型,得到所述训练好的随机森林模型中各个分类树的结果;根据所述各个分类树的结果中异常结果占所有结果的比例,确定所述用户行为数据对应的分类结果;将所述分类结果发送至第二客户端以进行显示。本申请的方法,增加了对用户行为数据分类的准确性。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种行为数据分类处理方法、装置、设备及存储介质。
背景技术
随着网络中网页和软件中可点击和可提交的内容越来越多,用户在网页和软件中的行为变得越发的不可预测,这容易导致出现安全问题。
目前,对容易导致安全问题的用户行为的分类和预分类通常是由人工进行的。
但是,由于用户行为种类庞大,人工对用户行为分类容易漏检或出错,导致出现分类准确性较低的问题。
发明内容
本申请提供一种行为数据分类处理方法、装置、设备及存储介质,用以解决人工分类准确性较低问题。
第一方面,本申请提供一种行为数据分类处理方法,包括:
接收第一客户端发送的用户行为数据,并根据用户行为数据确定目标数据;将目标数据输入训练好的随机森林模型,得到训练好的随机森林模型中各个分类树的结果;根据各个分类树的结果中异常结果占所有结果的比例,确定用户行为数据对应的分类结果;将分类结果发送至第二客户端以进行显示。
在一种可能的实现方式中,接收第一客户端发送的用户行为数据之前,还包括:获取历史用户行为数据;接收第三客户端发送的赋值信息,并根据赋值信息对历史用户行为数据进行赋值,得到赋值的历史用户行为数据,其中赋值的历史用户行为数据包括正常数据和异常数据;根据赋值的历史用户行为数据,确定标准历史用户行为数据;使用标准历史用户行为数据进行随机森林模型训练,得到训练好的随机森林模型。
在一种可能的实现方式中,根据赋值的历史用户行为数据,确定标准历史用户行为数据,包括:以所有异常数据为基础数据,计算得到新的异常数据,并将新的异常数据加入异常数据,直至异常数据的数据量达到赋值的历史用户行为数据的第一预设比例;将含有异常数据的数据量达到第一预设比例的赋值的历史用户行为数据确定为标准历史用户行为数据。
在一种可能的实现方式中,以所有异常数据为基础数据,计算得到新的异常数据,包括:以所有异常数据中任一异常数据作为基础数据,以所有异常数据中另一异常数据作为辅助数据,对基础数据和辅助数据进行差值,得到新的异常数据。
在一种可能的实现方式中,使用标准历史用户行为数据进行随机森林模型训练,得到训练好的随机森林模型,包括:在标准历史用户行为数据中有放回地抽取预设数量的数据作为训练集,将剩余未抽取到的数据作为测试集;使用训练集对初始的随机森林模型训练,得到待确定的随机森林模型;若将测试集输入待确定的随机森林模型得到的分类结果正确率小于第二预设比例,则重新执行根据赋值的历史用户行为数据,确定标准历史用户行为数据的步骤,并继续执行训练集与测试集的建立以及模型训练的步骤,直至得到的分类结果正确率超过第二预设比例时,得到训练好的随机森林模型。
第二方面,本申请提供一种行为数据分类处理装置,包括:
目标数据确定模块,用于接收第一客户端发送的用户行为数据,并根据用户行为数据确定目标数据;结果获得模块,用于将目标数据输入训练好的随机森林模型,得到训练好的随机森林模型中各个分类树的结果;分类结果获得模块,用于根据各个分类树的结果中异常结果占所有结果的比例,确定用户行为数据对应的分类结果;分类结果发送模块,用于将分类结果发送至第二客户端以进行显示。
在一种可能的实现方式中,行为数据分类处理装置,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111506939.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置