[发明专利]一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型及应用在审
申请号: | 202210576755.0 | 申请日: | 2022-05-25 |
公开(公告)号: | CN114913980A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 李峰;梅延成;葛飞;颜侃轩;武晨;易盛炜;魏铭;朱中南 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06Q10/06;G06N20/00;G06K9/62 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 张伟 |
地址: | 411105 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 蔬菜 重金属 富集 系数 膳食 暴露 人体 健康 风险 预测 模型 应用 | ||
1.一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:包括以下步骤:
步骤1):获取蔬菜的与重金属富集相关特征数据;
步骤2):对所述与重金属相关特征数据进行清洗和预处理;
步骤3):获取蔬菜经口膳食参数,并计算蔬菜经口膳食的人体健康风险值;
步骤4):建立蔬菜特征数据与蔬菜经口膳食的人体健康风险值的机器学习模型;
步骤5):对所得机器学习模型进行性能评价。
2.根据权利要求1所述的一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:所述重金属富集相关特征数据包括:蔬菜中重金属的富集系数、蔬菜种植土壤重金属浓度、种植区域和蔬菜种类。
3.根据权利要求2所述的一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:
所述蔬菜中重金属的富集系数为蔬菜中可食用部位的重金属浓度与蔬菜种植土壤中重金属浓度的比值;
所述种植区域按地理位置划分为:北方地区、东部地区、中部地区、南部地区和西南地区;
所述重金属包括:铬、镉、汞、砷、镍、铜和锌中至少一种。
4.根据权利要求1所述的一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:所述数据清洗和预处理过程,包括:I)对特征数据进行关联性验证,并分类;II)对特征数据进行格式清洗;III)对特征数据中的异常值进行删除清理;IV)对特征数据中的缺失值进行插值处理。
5.根据权利要求1所述的一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:所述蔬菜经口膳食参数包括:蔬菜中可食部位污染物浓度Cf,每日经口摄入的蔬菜量IR、暴露频率EF、暴露期ED、体重BW、平均暴露时间AT、消化道吸收效率因子ABSo和经口摄入参考剂量RfDo;所述计算蔬菜经口膳食的人体健康风险的方程为:
式1:
其中:HQ为蔬菜经口膳食的人体健康风险值,无量纲;Cf为蔬菜中可食部位污染物浓度,量纲为mg/kg;IR为每日经口摄入的蔬菜量,量纲为mg/d;EF为暴露频率,量纲为days/year;ED为暴露期,量纲为year;BW为体重,量纲为kg;AT为平均暴露时间,量纲为days;ABSo为消化道吸收效率因子,无量纲;RfDo为经口摄入参考剂量,量纲为mg/kg-day。
6.根据权利要求1或5所述的一种基于蔬菜的重金属富集系数与经口膳食暴露的人体健康风险的预测模型,其特征在于:
所述蔬菜特征数据与蔬菜经口膳食的人体健康风险值的机器学习模型采用随机森林分类模型,建立过程包括:
i)蔬菜经口膳食的人体健康风险值划分为以下四个风险等级:0HQ≤0.5为无风险、0.5HQ≤1为低风险、1HQ≤2为中风险和2HQ为高风险;
ii)将特征数据分为测试集数据和训练集数据,测试集数据占特征数据总量的50~80%;
iii)确定随机森林分类模型的主要参数,并将测试集数据与风险等级进行模型拟合,所述随机森林分类模型的主要参数包括:确定随机决策树的数量ntree和每颗决策树随机取样的预测变量的数量mtry;
iv)对测试集数据进行重要性分析,采用MeanDecreaseGini表示,其中Gini指数计算表达式为:
式2:
其中:n表示测试集数据的n个类别;p(i)为当前节点中第i个类别所占的比例;
v)采用测试集数据进行模型测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210576755.0/1.html,转载请声明来源钻瓜专利网。