[发明专利]一种多维用户特征向量筛选方法在审
申请号: | 201910514261.8 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110288010A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 赵素云;王振磊;秦波 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 王胥慧 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种多维用户特征向量筛选方法,其特征在于,包括以下步骤:1)抽取多维用户特征向量中的某一特征向量子集;2)计算该特征向量子集中每一特征向量对于用户类标的依赖度;3)将该特征向量子集中依赖度最大的特征向量加入候选特征向量子集,并确定候选特征向量子集的信息增量;4)采用集成学习方法,根据预先设定的判别条件,判断候选特征向量子集的信息增量是否满足要求,若信息增量不满足要求,则进入步骤2)重新抽取多维用户特征向量中的特征向量子集;若信息增量满足要求,则将该候选特征向量子集作为最优的特征向量子集,完成多维用户特征向量的筛选,本发明可以广泛应用于大规模多维用户数据前期预处理领域中。 | ||
搜索关键词: | 特征向量子集 用户特征向量 多维 候选特征 向量子集 信息增量 特征向量 依赖度 筛选 抽取 预处理 集成学习 判别条件 用户数据 应用 | ||
【主权项】:
1.一种多维用户特征向量筛选方法,其特征在于,包括以下步骤:1)抽取多维用户特征向量中的某一特征向量子集;2)计算该特征向量子集中每一特征向量对于用户类标的依赖度;3)将该特征向量子集中依赖度最大的特征向量加入候选特征向量子集,并确定候选特征向量子集的信息增量;4)采用集成学习方法,根据预先设定的判别条件,判断候选特征向量子集的信息增量是否满足要求,若信息增量不满足要求,则进入步骤2)重新抽取多维用户特征向量中的特征向量子集;若信息增量满足要求,则将该候选特征向量子集作为最优的特征向量子集,完成多维用户特征向量的筛选。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910514261.8/,转载请声明来源钻瓜专利网。