[发明专利]一种特征模型的生成、应用方法及装置有效

专利信息
申请号: 201610430985.0 申请日: 2016-06-16
公开(公告)号: CN107515876B 公开(公告)日: 2020-12-04
发明(设计)人: 陈钰雯 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/21 分类号: G06F16/21
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 朱佳
地址: 英属开曼群岛大开曼*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 特征 模型 生成 应用 方法 装置
【说明书】:

发明涉及计算机领域,特别涉及一种特征模型的生成、应用方法及装置,用以提高目标特征模型的精准度。该方法为:将特征数据输入目标特征模型,获得相应的描述信息,其中,所述目标特征模型用于描述一应用场景且是基于多个子特征模型生成的,所述多个特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,显然,不同的子特征模型在描述目标特征模型对应的应用场景时的侧重点不同,使得最终生成的目标特征模型可以从不同角度更全面地描述上述待分析的应用场景,从而增加了目标特征模型的精准度,进而提高了特征数据分析的准确度。

技术领域

本发明涉及计算机领域,特别涉及一种特征模型的生成、应用方法及装置。

背景技术

在数据分析过程中,为了更好地确定待分析对象的特点,一个重要的步骤便是特征的选取,特征的选取结果在很大程度上将会影响后期建模的效果,进而影响数据分析的结果。

现有技术下,在进行建模时,特征的选取一般采用两种方式:

第一种方式为:

选中提取出的所有特征,删除一些区分度不强的特征,通过训练样本对剩下的所有特征进行统一训练,从而建立统一的模型(如,采用决策树方式进行建模。

然而,采用第一种方式,通常只会选取出区分度最强的特征以及特征组合,因此,建立的模型也会着重描述这些特征及特征组合的特点,而一些次强的特征及特征组合可能被忽略,从而影响建模结果的精准度。

第二种方式为:

先对提取出的特征进行分组。然后,每一组特征分别采用相应的训练样本进行训练,分别生成相应的子模型,最后,再将所有子模型统一组成一个模型(如,采用随机森林方式进行建模,或者,采用boosting方式进行建模)。

然而,采用第二种方式,可能会在特征随机分组过程中,拆散区分度很强的特征组合,从而影响建模结果的精准度。并且由于特征分组是随机的,建模型结果是否理想只能靠统计学保证,这同样会影响建模结果的准确性。

发明内容

本发明实施例提供一种特征模型的生成、应用方法及装置,用以提高建模结果的精准度。

本发明实施例提供的具体技术方案如下:

一种特征模型的应用方法,包括:获取特征数据,所述特征数据中包含有至少一个特征;获取目标特征模型,所述目标特征模型用于描述一应用场景,是基于多个子特征模型生成的,其中,所述多个特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,一个特征的重要度表征所述一个特征对建模准确度的影响程度;将特征数据输入目标特征模型,获得所述特征数据在所述应用场景下的描述信息。

可选的,获取所述目标特征模型之前,进一步包括:生成所述目标特征模型,具体包括:针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。

可选的,基于获得的特征集合,生成多个子特征模型,包括:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610430985.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top