[发明专利]网络内容自动推荐方法、装置和系统有效
| 申请号: | 201310309049.0 | 申请日: | 2013-07-22 |
| 公开(公告)号: | CN103399891A | 公开(公告)日: | 2013-11-20 |
| 发明(设计)人: | 吴先超;陈龙 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 内容 自动 推荐 方法 装置 系统 | ||
技术领域
本发明涉及互联网技术领域,尤其涉及一种网络内容自动推荐方法、装置和系统。
背景技术
日常生活中,人们对互联网的依赖程度越来越高。大家可以通过互联网,获取资讯,联系朋友。于是,有的互联网站点开始收集用户的互联网访问数据,并通过对不同用户的互联网的历史访问数据的分析获知用户对哪些领域的资讯更为感兴趣,在依据这样的分析结果为用户推荐他们可能会喜爱的网络内容。
在这样的为用户推荐网络内容的方法中,大多数方法都需要使用机器学习算法来对用户进行分类,以确定用户感兴趣的领域。现有的网络内容推荐方法大都收集用户一段时间内的互联网访问数据,对这些数据进行人工标注以区分领域,利用标注好的数据通过机器学习的方法训练用户分类器,再利用训练好的用户分类器对用户进行分类,最后根据用户的分类向用户推荐网络内容。也就是说,现有的网络内容推荐方法多采用完全监督、非增量的机器学习方法对用户的互联网访问数据进行学习。现有的网络内容推荐方法虽然实现了向用户推荐网络站点,但是根据这种方法向用户推荐的网络内容不具有时效性。因为用户在不同的时间段的兴趣点可能会不同,而根据现有的方法向用户推荐的内容是不会发生改变的。而且,训练用户分类器需要人工对大量的互联网访问数据进行标注,成本较高。
发明内容
有鉴于此,本发明提出一种网络内容自动推荐方法、装置和系统,能够使得向用户推荐的网络内容更具有时效性,同时大幅降低在分类器训练阶段人工数据标注的工作量。
第一方面,本发明实施例提供了一种网络内容自动推荐方法,所述方法包括:
接收网络文本数据,从接收的网络文本数据中提取关键词;
利用所述关键词按照增量学习的方式训练关键词分类器;
接收特定用户的网络文本数据,根据所述关键词分类器对从所述特定用户的网络文本数据中提取的关键词的分类结果对所述特定用户进行分类;以及
根据对所述特定用户的分类,并按照预先定义的网络内容的分类向特定用户推荐特定用户感兴趣的网络内容。
第二方面,本发明实施例提供了一种网络内容自动推荐装置,所述装置包括:
关键词提取模块,用于接收网络文本数据,从接收的网络文本数据中提取关键词;
关键词分类器训练模块,用于利用所述关键词按照增量学习的方式训练关键词分类器;
特定用户分类模块,用于接收特定用户的网络文本数据,根据所述关键词分类器对从所述特定用户的网络文本数据中提取的关键词的分类结果对所述特定用户进行分类;以及
网络内容推荐模块,用于根据对所述特定用户的分类,并按照预先定义的网络内容的分类向特定用户推荐特定用户感兴趣的网络内容。
第三方面,本发明实施例提供了一种网络内容自动推荐系统,包括服务器和客户端,所述服务器包括如上第二方面所述的网络内容自动推荐装置。
本发明利用半监督学习方法进行增量学习,训练关键词分类器,然后利用训练的关键词分类器将用户区分为多个类别,最后根据每个用户的类别向用户推荐网络内容,不仅实现了根据互联网用户的个人兴趣向用户推荐网络内容,而且能够根据用户个人兴趣的变化实时改变站点推荐的类别,并且省去了分类器训练过程中的大量人工数据标注。
附图说明
图1是本发明第一实施例提供的网络内容自动推荐方法的流程示意图。
图2是本发明第一实施例提供的关键词提取的流程示意图。
图3是本发明第一实施例提供的特定用户分类的流程示意图。
图4是本发明第一实施例提供的网络内容推荐的流程示意图
图5a是本发明第一实施例提供的向用户推荐网络站点的图形用户界面的示意图。
图5b是本发明第一实施例提供的经过增量学习后向用户推荐网络站点的图形用户界面的示意图。
图6是本发明第二实施例提供的网络内容自动推荐装置的结构示意图。
图7是本发明第三实施例提供的网络内容自动推荐系统的结构示意图。
具体实施方式
下面结合附图并通过具体实施例来进一步说明本发明的技术方案。
图1至图5b示出了本发明的第一实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310309049.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





