[发明专利]日志分类模型的建立、行为日志分类方法及装置有效
申请号: | 201310331868.5 | 申请日: | 2013-08-01 |
公开(公告)号: | CN103455411A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 黄世维;黄硕;徐倩;向伟 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种日志分类模型的建立、行为日志分类方法及装置。一方面,本发明实施例通过根据每个Session段中所包括的行为日志的检索关键词、题目和URL,获得每个所述Session段中每个行为日志的对应字段所属的至少一个第一候选主题,进而根据所述至少一个第一候选主题,利用投票方法,确定每个所述Session段所属的第二候选主题,使得能够将每个所述Session段所属的第二候选主题,作为每个所述Session段中每个行为日志所属的主题,以作为目标训练数据,由于通过对行为日志进行基于主题的分类,实现对该行为日志的统计,能够避免现有技术中由于很多行为日志缺少Query或Title等字段而导致的无法对行为日志进行统计的问题,从而提高了行为日志的分析的准确性。 | ||
搜索关键词: | 日志 分类 模型 建立 行为 方法 装置 | ||
【主权项】:
一种日志分类模型的建立方法,其特征在于,包括:从至少一个数据源中,获取指定用户的行为日志;对所述行为日志进行划分,以获得至少一个Session段;根据每个所述Session段中所包括的行为日志的检索关键词、题目和URL,获得每个所述Session段中每个行为日志的对应字段所属的至少一个第一候选主题;根据所述至少一个第一候选主题,利用投票方法,确定每个所述Session段所属的第二候选主题;将每个所述Session段所属的第二候选主题,作为每个所述Session段中每个行为日志所属的主题,以作为目标训练数据;利用所述至少一个第一候选主题和所述目标训练数据,训练日志分类模型,所述日志分类模型用于将待分类的行为日志映射到对应主题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310331868.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种泥螺饼干及其制作方法
- 下一篇:动态展示区域空气质量和气象场的方法