[发明专利]性别分类模型的生成方法、性别填充方法、终端及存储介质在审
申请号: | 201711176286.9 | 申请日: | 2017-11-22 |
公开(公告)号: | CN107886366A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 黄程波 | 申请(专利权)人: | 深圳市金立通信设备有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 深圳市精英专利事务所44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市福田区深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 性别 分类 模型 生成 方法 填充 终端 存储 介质 | ||
技术领域
本发明涉及电子技术领域,尤其涉及一种性别分类模型的生成方法、性别填充方法、终端及存储介质。
背景技术
目前,随着互联网技术的发展和电子商务的普及,以及高性能的智能移动终端逐渐普及,移动互联网为用户打造了一个全新的通讯环境,能够极大地满足用户的差异化需求,移动应用也以令人吃惊的速度不断丰富。其中,电子商务通常是指在全球各地广泛的商业贸易活动中,在开放的移动互联网环境下,基于浏览器/服务器应用方式,买卖双方线上进行各种商贸活动。然而,区别于传统线下服务模式,在线上交易过程中,商户对用户的个人基础信息不甚了解,导致商户对用户的需求了解有一定的局限性,容易造成一些广告和促销的无效投放或广告等营销措施难以实现预期的目标等情况。因此,研究预测用户的基本属性信息和历史行为对精准定位用户的需求非常有必要,以便为用户提供更好的个性化服务。其中,用户的性别信息作为人口统计最基本的指标,是构建用户画像标签体系中最重要的组成之一。性别信息结合用户的其他基本属性及用户的历史行为常用于分析洞察用户的兴趣爱好和个性化需求,在人群定向中,性别是最重要的筛选条件之一。然而用户基础属性信息如性别、年龄等一般被用户视为个人隐私信息,用户在各个平台如微信、新浪的注册过程中都会选择性不填写这类个人隐私信息,因此,很多的网络应用公司很难获得用户的性别、年龄等基础属性信息。
现有技术中,获取用户的性别信息基本依赖于用户所填写的性别信息或者运用某个单一业务的数据进行建模预测得到的性别信息这两种方式。比如,一些网络应用公司在用户注册个人账号时会强制要求用户填写或让用户选择性填写性别信息,但是这类个人隐私信息对于用户来说比较敏感。因此,对于强制要求填写的注册信息,用户的体验效果较差,对于部分注重隐私的用户甚至会容易引起用户的反感,再者用户也可能故意填写错误的信息,这些虚假的信息对用户的个性化推荐会有负作用。而实际情况是大部分用户在注册时都没有填写相关的基础属性信息如性别信息等。现有技术还通过获取用户安装的App应用名称或者一系列安装包名称列表等单一数据建模来预测性别,并将预测出来的性别作为用户最终的性别标签。然而,如果只是依靠用户在单一业务上的行为数据建立模型,进行性别预测,容易导致预测出来的性别的准确度较低,即便性别预测的准确度较高,采集的行为数据只是该单一业务的用户群体,用户群体的覆盖面较窄,其他业务的用户的性别还是空缺的。
因此,要解决现有技术中依靠用户填写性别或运用某个单一业务数据进行建模预测性别存在的问题,需要一种能运用多个业务的数据并结合用户使用的APP类别及其历史行为数据建立性别分类模型,从而根据性别分类模型预测用户的性别标签,进而能对多个业务的所有用户的性别进行有效填充。
发明内容
本发明实施例提供一种性别分类模型的生成方法、性别填充方法、终端及存储介质,可以通过置信度较高的用户的性别数据集和行为数据集作为训练数据集训练出性别分类模型,并通过算法调优参数及测试数据集交叉验证出最优性别分类模型;并可以通过该最优性别分类模型预测填充多个业务中没有性别信息的用户或置信度较低的用户的性别标签,提高平台中所有用户最终判定的性别标签的整体准确度。
第一方面,本发明实施例提供了一种性别分类模型的生成方法,该方法包括:获取用户在多个业务中的性别数据集及其在多个应用程序中的行为数据集以生成目标矩阵表;根据所述目标矩阵表中的所述性别数据集筛选出所述多个业务的待训练用户,所述待训练用户包括在多个预设业务中均含有性别信息且性别信息相同的用户集合;将所述待训练用户在所述目标矩阵表中的性别数据集和行为数据集转换为训练性别分类模型的特征数据集,其中所述特征数据集包括训练数据集和测试数据集;根据所述训练数据集,采用决策树算法训练出所述性别分类模型;根据算法调优参数和所述测试数据集交叉验证所述性别分类模型,得到最优性别分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市金立通信设备有限公司,未经深圳市金立通信设备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711176286.9/2.html,转载请声明来源钻瓜专利网。