[发明专利]分类模型的训练方法、分类方法及相关设备、分类系统有效
申请号: | 201910860182.2 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110704706B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 郑方园;杨舒宁;杜文滔;吕雪芬;李艳龙 | 申请(专利权)人: | 北京海益同展信息科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/9535;G06Q30/02 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 相关 设备 系统 | ||
本申请实施例公开了一种分类模型的训练方法、分类方法及相关设备和分类系统,其中,所述分类方法包括:获得待分类数据,所述待分类数据包括至少两个待分类用户及其多个特征信息;获得与各个特征信息对应的第一参数,所述第一参数为表征为特征信息对实现用户分类的贡献度的参数;基于每个待分类用户的特征信息和与特征信息对应的第一参数,对所述待分类用户进行需要推送或投放多媒体信息的用户和不需要推送或投放多媒体信息的用户的分类;根据对待分类用户的分类结果,确定是否对每个待分类用户进行所述多媒体信息的推送或投放。
技术领域
本申请涉及预测领域,具体涉及到一种分类模型的训练方法、分类方法及相关设备和分类系统。
背景技术
对于电商和多媒体信息推广平台如广告平台来说,彼此为了获取更大的经济收益,通常电商与广告平台会达成一致,在电商平台的显示页面中进行广告页面的显示,和/或广告平台会推出有关该电商的广告。在实际应用中,不同的用户的购买需求、购买能力、喜好等均不相同,对于一条待推送的广告信息而言,该广告信息无法受每一个用户的欢迎,如果广告平台对所有用户均进行该广告信息的推送,将会浪费广告平台大量的推送资源。如果广告平台能够有针对性的推送、推送给可能需要该条广告的用户,那么是必实现了多媒体信息的针对性推送,减少对推送资源的浪费。可见,如何实现对潜在用户(可能需要该广告和/或通过该广告进行商品购买的用户)和非潜在用户的分类成为了研究热点。相关技术中,大多结合用户在购买需求、购买能力、喜好等几个方面的特点去预测或识别该用户是否能成为潜在用户,进而实现对潜在用户和非潜在用户的分类,这种分类方法过于粗略,无法保证准确性。
发明内容
为解决现有存在的技术问题,本申请实施例提供一种分类模型的训练方法、分类方法及相关设备和分类系统,至少能够实现对潜在用户和非潜在用户的准确区分,提高分类准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种分类模型的训练方法,包括:
获得第一数据,所述第一数据表征为多个用户及每个用户的多个特征信息;
获得第二数据,所述第二数据表征为被预推送或预投放有多媒体信息的用户针对所预推送或预投放的多媒体信息而产生的反馈数据;
依据所述第一数据和第二数据进行训练数据的构建;
对构建的训练数据进行预处理,得到目标训练数据;
基于目标训练数据对所述分类模型进行训练;
利用基于所述目标训练数据得到的所述分类模型,对需要推送或投放所述多媒体信息的用户和不需要推送或投放所述多媒体信息的用户进行分类。
前述方案中,所述对构建的训练数据进行预处理,得到目标训练数据,包括:
依据所述多个特征信息中的至少部分特征信息的特征值进行用户的筛选,得到多个目标用户,所述目标用户为被预推送或预投放所述多媒体信息的用户;
依据所述目标用户的特征信息及目标用户针对所述多媒体信息产生的反馈数据,得到所述目标训练数据。
前述方案中,所述对构建的训练数据进行预处理,得到目标训练数据,包括:
针对各个特征信息中的任意一个特征信息,
计算在所有用户中该特征信息具有特征值的用户占所述所有用户的比例;
依据所述比例,从各个特征信息中筛选出目标特征;
依据所述目标特征和所述第二数据,得到所述目标训练数据。
前述方案中,所述方法还包括:
针对各个特征信息中的任意一个特征信息,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海益同展信息科技有限公司,未经北京海益同展信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860182.2/2.html,转载请声明来源钻瓜专利网。