[发明专利]基于机器学习的潜在特定人员行为预测方法及其应用在审
申请号: | 202310543503.2 | 申请日: | 2023-05-15 |
公开(公告)号: | CN116503951A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 李圣权;丁睿祎;陈徐;叶俊宏;曹鹏寅 | 申请(专利权)人: | 城云科技(中国)有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/764;G06V10/774;G06V10/762 |
代理公司: | 杭州汇和信专利代理有限公司 33475 | 代理人: | 周竑 |
地址: | 310052 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 潜在 特定 人员 行为 预测 方法 及其 应用 | ||
本申请提出了基于机器学习的潜在特定人员行为预测方法及其应用,包括以下步骤:S00、构建单一特征集;S10、基于梯度提升决策树的双向分组特征挖掘;S20、通过过采样方法对正面样本基础数据集和负面样本基础数据集进行样本数据不平衡问题的优化;S.0、基于优化后的正面样本基础数据集和负面样本基础数据集建立潜在特定人员预测模型,并通过扩充后的单一特征集进行训练,以得到训练完成的潜在特定人员预测模型;S40、输入待预测人员的样本数据,重复S00~S10步骤处理后输出预测结果。本申请能够协助人工构建有效的特定行为预防机制,让特定行为预防和智慧城市治理更加科学化、智能化。
技术领域
本申请涉及数据挖掘与机器学习技术领域,特别是涉及一种基于机器学习的潜在特定人员行为预测方法及其应用。
背景技术
在潜在特定人员预测应用场景方面,目前市场上并未出现基于大数据挖掘与人工智能技术对特定行为工作进行建模的方法或技术。
已有的潜在特定行为相关风险预测主要还是通过以下手段实现:
1)依靠基层回访手段进行,即收集特定行为类数据,基于此对曾有过特定行为史的家庭通过电话等方式进行定期回访,在回访过程中发现异常再预警,整个过程均依靠人工手段实现,耗时耗力;
2)基于人工制定的打分规则实现,对个人的每一个特征赋打分权重,通过简单的加减统计判断是否会特定行为以及风险等级,最终结果过于依赖人工制定的打分规则,具有很强的个人主观性与局限性。除此之外,剩下的特定行为预防工作主要集中在仍侧重于日常宣传与事后补救层面,而把预防层面仅作为辅助,也没有充分利用已有的数据资源实现智能化预警。
同时,潜在特定人员预测问题可以看作是类似于机器学习领域中的分类应用问题,即样本中包含正负两种标签的样本(有特定行为的人看作正样本,没有特定行为的人看作负样本),从未知人员中预测出潜在特定人员就是对未知人员进行正负标签自动分类。在解决类似的特殊人员预测问题方面,已有的方法主要包括:
1)基于指标的方法:即获取特殊人员信息,设定预测指标,通过指标分析、指标拆分等方法对指标进行评估或赋权重,构建一套具体的指标体系后获得预测结果;
2)基于机器学习的方法:即将人员预测问题看作机器学习中的分类问题,首先获取特殊人员信息,选择相关特征值构建数据集,接着使用机器学习模型(包括传统的统计机器学习模型以及更为复杂的神经网络模型等)进行训练,最后通过训练所得的模型进行自动预测。
综上,虽然研究者们在类似的特殊人员预测方面一定的进展,但是,这些方法在实际应用中仍面临许多问题,主要体现在:样本特征不足,所训练出的模型预测准确性难以提高;同时还存在样本不平衡问题:在实际情况中,与基本人口数据相比,特殊人群属于少数人群,特定行为人员也是如此,因此从本质上来看,潜在特定人员的预测属于不平衡样本分类问题。当样本比例不平衡时,在模型训练时通常会偏重于数量更多的那类样本,从而导致预测结果出现偏差,模型可能会将少数类样本视为噪声数据并将其错分为正类,导致少数类的预测效果被严重减弱。
基于以上两个问题,本发明提出一种基于机器学习的潜在特定人员行为预测方法,以解决上述技术问题。
发明内容
本申请实施例提供了基于机器学习的潜在特定人员行为预测方法及其应用,针对目前技术存在的样本特征不足、预测准确度不高、样本不平衡等问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于城云科技(中国)有限公司,未经城云科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310543503.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食盐装箱追溯系统
- 下一篇:基于边缘位置接触的保温一体板打磨装置