[发明专利]基于随机森林的戒毒人员戒治效果的评估方法有效
申请号: | 202110863567.1 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113658680B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 陆宇升;廖淑珍;陶炜;朱晓东;许金礼;吕思霖 | 申请(专利权)人: | 广西友迪资讯科技有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06N20/00 |
代理公司: | 南宁启创知识产权代理事务所(特殊普通合伙) 45122 | 代理人: | 余小宁 |
地址: | 530000 广西壮族自治区南宁市*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 戒毒 人员 效果 评估 方法 | ||
本发明公开一种基于随机森林的戒毒人员戒治效果的评估方法,本发明涉及戒毒领域和机器学习领域,包含目标函数和特征的选择、训练模型和评估过程;在戒毒人员多维度戒毒数据中选择一个维度YD作为目标函数,从戒毒人员多维度戒毒数据选择一组特征FD,建立训练数据集TrainSet样本集合,训练随机森林回归模型,计算得到被评估人员的YD和类似戒毒人员平均值的偏差是标准差的倍数LSS、被评估人员的YD和整体平均值的偏差是标准差的倍数GSS,综合进行评估。本发明评估方法适应性强,当制度变化,技术进步导致数据发生巨大变化之后,可以通过重新训练模型的方式快速适应变化、且精确度更高。
技术领域
本发明涉及戒毒领域和机器学习领域,尤其涉及一种基于随机森林的戒毒人员戒治效果的评估方法。
背景技术
虽然目前已经提出很多强制戒毒人员戒治效果的评估方法,但是在实际操作过程中,普遍存在操作难度较大、评估信度效度较低的问题。另外,现有的评估方法的设计均基于经验,无法快速灵活改变参数,难以适应新技术发展、信息系统和相关制度变化带来的环境变化。
现有戒毒信息系统中已经有大量的数据和戒治效果直接相关,例如计分考核数据、考试成绩、医疗检验结果和康复训练数据等;但这些数据缺乏统一标准,各地域之间差别巨大,每次制度变化和技术进步,都会导致这些数据发生巨大变化,直接从这些数据中靠人工分析方式评价戒治效果很困难,不直观,评估结果精确度严重依赖于评估人员的经验。
发明内容
为解决上述技术问题,本发明提供一种基于随机森林的戒毒人员戒治效果的评估方法,建立完全基于数据的戒治效果评估模型,排除人为主观因素,以实现通过构造数据集重新训练方式随时更新模型,能够快速灵活适应环境的变化,同时也能适应不同地域的技术、制度环境巨大的差别。
为实现上述目的,本发明提供如下技术方案:
一种基于随机森林的戒毒人员戒治效果的评估方法,包含目标函数和特征的选择、训练模型和评估过程;其中,
(1)目标函数和特征选择:
在戒毒人员多维度戒毒数据中选择一个维度YD作为目标函数,所述YD是与所述戒治效果直接相关的量化指标;
从戒毒人员多维度戒毒数据选择一组特征FD,所述FD为戒毒人员的静止属性;
(2)训练模型:
a、建立训练数据集TrainSet样本集合,其中的每一样本对应多维度戒毒数据中一个人员的数据;
b、训练随机森林回归模型RFM,从TrainSet中提取样本并放入子集ModelTrainSet中,用于随机森林训练;
c、将所述RFM中所有叶子节点放到统一的叶子节点数组lnodes中,使用RFM对人员特征向量f进行回归,计算命中叶子节点的所有TrainSet样本的均值LNMEAN数组和标准差LNSTD数组;计算TrainSet全体的目标函数值的标准差和平均值,保存到GSTD和GMEAN中;
d、保存RFM、GMEAN、GSTD、LNSTD和LNMEAN;
(3)评估过程:
a、从存储介质加载训练过程得到的RFM、GMEAN、GSTD、LNSTD和LNMEAN;
b、用随机森林回归算法根据模型RFM预测被评估人员的目标函数YD值,获得命中的RFM叶子节点,计算被评估人员的YD和类似戒毒人员平均值的偏差是标准差的倍数LSS;
c、计算被评估人员的YD和整体平均值的偏差是标准差的倍数GSS,
其公式为GSS=(YD-GMEAN[m])/GSTD[m];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西友迪资讯科技有限公司,未经广西友迪资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110863567.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种直燃式点火装置
- 下一篇:一种木质夹自动定位夹紧碎料收集装置