[发明专利]强变量提取方法及装置有效
申请号: | 201610416751.0 | 申请日: | 2016-06-12 |
公开(公告)号: | CN106095942B | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 刘志斌;陈培炫;陈谦 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种强变量提取方法及装置;方法包括:基于基础变量池中的基础变量构造强变量,形成用于第k轮迭代训练的强变量候选集;基于所述强变量候选集对特征筛选模型进行第k轮迭代训练,k为取值依次增大的正整数,且k取值满足k≥1;将所述特征筛选模型输出的特征并入到入选特征集合,所述输出的特征为对所述特征筛选模型进行第k轮迭代训练后在所述强变量候选集中提取的强变量;基于第k轮迭代训练后所述特征筛选模型的残差确定需要对所述特征筛选模型进行第k+1轮迭代训练;筛除所述基础变量池中用于构造所述入选特征集合中的特征所使用的基础变量。实施本发明,能够从弱变量中有效提取强变量。 | ||
搜索关键词: | 变量 提取 方法 装置 | ||
【主权项】:
1.一种强变量提取方法,其特征在于,所述方法包括:基于基础变量池中的基础变量构造强变量,形成用于第k轮迭代训练的强变量候选集;基于所述强变量候选集对特征筛选模型进行第k轮迭代训练,k为取值依次增大的正整数,且k取值满足k≥1;将所述特征筛选模型输出的特征并入到入选特征集合,所述输出的特征为对所述特征筛选模型进行第k轮迭代训练后所述特征筛选模型在所述强变量候选集中提取的强变量;基于第k轮迭代训练后所述特征筛选模型的残差确定需要对所述特征筛选模型进行第k+1轮迭代训练;筛除所述基础变量池中用于构造所述入选特征集合中的特征所使用的基础变量;其中,所述特征获取模型用于从包括用户的行为日志、广告物料的文本描述的弱变量中提取有效的、具有预测力的强变量,或者,用于从包括用户的各种数据的弱变量中提取出能够反映用户的还款能力或还款意愿的强变量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610416751.0/,转载请声明来源钻瓜专利网。