[发明专利]终端推荐方法和终端推荐系统在审
申请号: | 201910458421.1 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110163525A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 许丹丹;张第;刘楠;刘颖慧;赵慧 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06;G06F16/335 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;杜丹丹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 终端 字段 基础数据 模型输入数据 推荐系统 信息过载 模型训练 数据采集 训练结果 用户发现 用户需求 终端用户 搜索 帮助 | ||
1.一种终端推荐方法,其特征在于,包括如下步骤:
S1.对每个用户的多个基础数据字段进行衍生处理,以得到数倍于所述基础数据字段的衍生字段;
S2.将所述基础数据字段与所述衍生字段作为每个用户的模型输入数据集,将大量用户的模型输入数据集输入到LGB模型中进行多次模型训练,并根据每次训练结果调整所述LGB模型的参数,直至得到最优LGB模型;
S3.将待推荐终端用户的数据采集值输入至所述最优LGB模型中,得出终端推荐结果并推荐给该用户。
2.根据权利要求1所述的终端推荐方法,其特征在于,在步骤S1之前还包括:
S0.对从每个用户处采集的多个原始数据字段进行填充处理,再将填充处理后的原始数据字段进行归类处理,以得到多个基础数据字段。
3.根据权利要求1所述的终端推荐方法,其特征在于,所述步骤S1包括:
S101.从每个用户的多个基础数据字段中选出N个在计数统计方面具有特殊性的字段,再将其分别与所述基础数据字段中的套餐类型字段和合约类型字段进行交叉计数,共计得到3N个统计类交叉字段,且1<N<10,N为整数;
S102.从每个用户的多个基础数据字段中反推出M个具有业务意义的字段作为业务衍生字段,且10<M<25,M为整数;
S103.将每个用户的多个基础数据字段中的当月出账金额及当月前L个月中每个月的出账金额作为w2v模型的输入字段,在所述w2v模型内依次经过数值型数据转化为文本类类型、文本集转化和w2v上下文感知处理后,每个输入字段对应输出K维向量,共计输出K*(L+1)个字段,且1<L<5,5<K<50,L和K均为整数;
步骤S101、S102和S103得到的字段之和为所述衍生字段。
4.根据权利要求1所述的终端推荐方法,其特征在于,所述步骤S2包括:
S201.将大量用户的模型输入数据集分割为X个训练集和Y个测试集,所述训练集涉及的用户的终端编码未知,所述测试集涉及的用户的终端编码已知,且1<X/Y<5,X和Y均为整数;
S202.将所述X个训练集和所述Y个测试集输入至所述LGB模型中,得到X个训练集的预测结果和Y个测试集的预测结果;
S203.将所述X个训练集的预测结果、所述Y个测试集的预测结果和所述Y个测试集的实际结果采用F1-score评价方法进行评价;
S204.根据所述步骤S203的评测结果调整所述LGB模型的参数;
S205.重复执行步骤S201至S204,直至得到最优LGB模型。
5.根据权利要求4所述的终端推荐方法,其特征在于,所述步骤S203中,F1-score评价方法的计算方式如下:
式(1)中,f1k的计算方式如下:
式(2)中,precisionk的计算方式如下:
式(2)中,recallk的计算方式如下:
式(3)和(4)中,TP为预测答案正确的数量,FP为错将其他类预测为本类的数量,FN为本类标签预测为其他类标的数量。
6.一种终端推荐系统,其特征在于,包括:
衍生单元,用于对每个用户的多个基础数据字段进行衍生处理,以得到数倍于所述基础数据字段的衍生字段;
模型训练单元,用于将所述基础数据字段与所述衍生字段作为每个用户的模型输入数据集,将大量用户的模型输入数据集输入到LGB模型中进行多次模型训练,并根据每次训练结果调整所述LGB模型的参数,直至得到最优LGB模型;
推荐单元,用于将待推荐终端用户的数据采集值输入至所述最优LGB模型中,得出终端推荐结果并推荐给该用户。
7.根据权利要求6所述的终端推荐系统,其特征在于,还包括:
数据预处理单元,用于对从每个用户处采集的多个原始数据字段进行填充处理,再将填充处理后的原始数据字段进行归类处理,以得到多个基础数据字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910458421.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理