[发明专利]用户性别分析方法和装置有效
申请号: | 201310526980.4 | 申请日: | 2013-10-30 |
公开(公告)号: | CN104598452B | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 丁若谷;陈家耀;冯是聪;吴明辉 | 申请(专利权)人: | 秒针信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王丹;栗若木 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种用户性别分析方法和装置。涉及数据分析领域;解决了现有分析方式不适用于个性域名和姓名关联较弱的场合的问题。该方法包括:采集样本数据集,所述样本数据集包括多对用户个性域名和对应的用户性别;统计所述样本数据集中的用户个性域名中各顺位上不同字母和相邻若干顺位上不同字母组合按照性别出现的概率;以所述样本数据集中男性的比例和所述概率作为参考参数,对未知用户性别的用户个性域名进行分析,判断所述用户性别。本发明提供的技术方案适用于数据分析,实现了基于自动化算法的用户性别分析。 | ||
搜索关键词: | 用户 性别 分析 方法 装置 | ||
【主权项】:
1.一种用户性别分析方法,其特征在于,包括:采集样本数据集,所述样本数据集包括多对用户个性域名和对应的用户性别;统计所述样本数据集中的用户个性域名中各顺位上不同字母和相邻若干顺位上不同字母组合按照性别出现的概率,包括:步骤a:取一个用户个性域名中用户指定的部分,同时记录该用户个性域名对应的用户性别;步骤b:对所述指定的部分的各顺位上字母出现的次数和/或相邻若干顺位上不同字母组合出现的次数进行计数;步骤c:对所述样本数据集中的全部用户个性域名进行如步骤a至b的处理,直至所述样本数据集遍历完成;步骤d:统计所述用户个性域名各顺位上字母对于不同性别出现的次数和/或相邻若干顺位上的字母组合对于不同性别出现的次数,并计算各顺位上字母和/或相邻若干顺位上字母组合对于不同性别出现的概率;以所述样本数据集中男性的比例和所述概率作为参考参数,对未知用户性别的用户个性域名进行分析,判断所述用户性别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秒针信息技术有限公司,未经秒针信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310526980.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于XML的信息搜索方法
- 下一篇:一种印前编目数据本地化的解决方法