[发明专利]基于局部线性化的复杂机器学习模型解释方法及装置在审
申请号: | 201710620391.0 | 申请日: | 2017-07-26 |
公开(公告)号: | CN107392318A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 郑乐;胡伟;李勇;王春明;徐遐龄 | 申请(专利权)人: | 清华大学;国家电网公司华中分部;国家电网公司 |
主分类号: | G06N7/00 | 分类号: | G06N7/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于局部线性化的复杂机器学习模型解释方法及装置,其中,方法包括采集样本集中任意一点作为样本点,并在样本点周围随机采样得到多个采样点;在表达空间中,获取样本点与每个采样点间的欧拉距离,以作为每个采样点的权重;根据每个采样点的权重和线性模型得到待解释的机器学习模型和解释函数的拟合结果的差距,以获取寻优问题;优化求解寻优问题中使用正则化项惩罚因子的线性回归问题,并得到解释结果。该方法可以在每个数据点的邻域内对复杂机器学习模型进行解释,充分考虑样本空间的局部特性,不但可以有效寻找样本空间不同区域的主导特征,而且更加直观、便捷,可适用于多种机器学习模型的解释。 | ||
搜索关键词: | 基于 局部 线性化 复杂 机器 学习 模型 解释 方法 装置 | ||
【主权项】:
一种基于局部线性化的复杂机器学习模型解释方法,其特征在于,包括以下步骤:采集样本集中任意一点作为样本点,并在所述样本点周围随机采样得到多个采样点,且根据原机器学习模型得到所述多个采样点的每个采样点的机器学习模型预测结果;在表达空间中,获取所述样本点与所述每个采样点间的欧拉距离,以作为所述每个采样点的权重;根据所述每个采样点的权重和线性模型得到待解释的机器学习模型和解释函数的拟合结果的差距,并得到所述解释函数的复杂度,以获取寻优问题;以及优化求解所述寻优问题中使用正则化项惩罚因子的线性回归问题,并得到解释结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;国家电网公司华中分部;国家电网公司,未经清华大学;国家电网公司华中分部;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710620391.0/,转载请声明来源钻瓜专利网。