[发明专利]一种基于领域本体的多源个性化新闻网页推荐方法在审
申请号: | 201410797816.1 | 申请日: | 2014-12-19 |
公开(公告)号: | CN104484431A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | 吴信东;谢飞;胡学钢;宫雪;郭建波 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 领域 本体 个性化 新闻 网页 推荐 方法 | ||
技术领域
本发明属于个性化推荐领域,具体地说是一种基于领域本体的多源个性化新闻推荐方法。
背景技术
随着互联网规模的迅速发展,人们获取信息的方式越来越多,信息呈爆炸式增长,用户逐渐由信息匮乏走向了信息过载时代——海量信息使得用户难以寻找到各自所需的信息。为了方便用户从海量信息中寻找其所需的内容,出现了很多解决方案:包括分类目录和搜索引擎。分类目录是把常用热门网站分门别类,便于用户查找信息。但是,随着互联网规模的扩大,分类目录只能覆盖少量热门网站。搜索引擎使得用户只需把自己的需求转换成关键词的不同组合,再在网络中寻找其所需的需求。然而,由于成本、版面等原因的限制,往往只能将网站或信息分为数个或十数个类别,这样的分类粒度往往并不能满足用户的需求。搜索引擎则是只需用户把自己的需求转换成关键词的组合在网络中查找所需的信息。然而由于搜索引擎面向的是所有用户,它返回的结果往往具有通用性,不能满足出于不同维度上的查询要求。
个性化推荐技术正是在这样的背景下应运而生的,它是今后网站发展的整体趋势,同时也是互联网领域的一个研究热点。所谓个性化新闻推荐就是将个性化推荐技术应用于新闻资讯领域的推荐。它可以帮助用户从海量的新闻资讯中轻松快速地发掘自己可能感兴趣的资讯,为用户节省了大量的时间和精力。著名电子商务网站Amazon销售额中的35%是来自推荐系统。由此可见,推荐系统在提高了用户的满意度的同时,也提高了网站的黏性,增加了网站访问量,为网站带来巨大的商业利益。
在个性化推荐领域中,网页这类文本内容的推荐又是一个非常重要的领域,如何从海量的信息中计算得到海量用户可能感兴趣的内容推荐给用户,是一个极具挑战性的技术领域。现有的技术主要有两种技术方案比较流行,具体来说,包括:
(1)基于协同过滤的个性化推荐方法
基于协同过滤的推荐算法(Collaborative Filtering Recommendation)是通过一组用户的偏好来向其他用户进行推荐的。这种方法的推荐对象可以是新闻、图书、音乐、视频以及实物等任意对象。根据机器学习理论,基于协同过滤的推荐算法隶属于实例的学习范畴。同时,该推荐方法对于一些特殊品味的用户不能给予很好的推荐。这类用户首先具有特殊性,其次,其想要获得新闻、图书等也具有特殊性。
(2)基于内容的个性化推荐算法
基于内容的推荐(Content-based Recommendation)主要是根据分析用户已经读取过的内容与待推荐内容之间的相似性进行推荐的。随着机器学习等技术的不断完善,基于内容的推荐方法又可以对用户和内容分别建立对应的配置文件,通过分析用户已经读取过的内容,建立或更新用户的配置文件。基于内容的推荐算法的根本在于信息获取和信息过滤。因为在文本信息获取与过滤方法的研究较为成熟,现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐。该方法的不足之处是:如何对新用户的推荐,因为新用户没有历史信息,无法构建其对应的配置文件。
与此同时,在研究如何根据用户兴趣偏好进行个性化推荐的过程中,构建语义概念网络就显得十分重要,本体(Ontology)是目前应用十分广泛的方法。
本体的构成主要包括实例(Instance/Individual)、概念(Concept/Class)、属性(Attribute)和关系(Relation),更完整的本体还会包括限制(Restriction)和定理(Axioms)等。实例描述领域中的相关个体;概念则是实例的类别和集合,归类领域中的个体类别;属性是用户描述实例和类别的特征;而关系用于描述实例或类别与其他实例或类别之间的关联。广义的本体包括从简单到复杂多种形式的知识描述系统。分类系统(Taxonomy)是一种最简单的本体,所有的概念依据is-a关系构成一个树状(或者森林)结构,比如生物的分类系统,门纲目属种中的生物类别根据is-a构成所有已知生物的关系树。在构建不同领域的本体时,可能出现非常复杂的推理规则,而这往往也是构建本体需要领域专家的原因之一。本体的构建为计算和联想提供逻辑上的支持,因为联想具有关联性。考虑到本体自身的特点,通过本体(Ontology)去寻找这种关联更加符合语义逻辑关系和联想的过程。
发明内容
本发明为解决现有技术存在的不足之处,提出一种基于领域本体的多源个性化新闻推荐方法,以期能挖掘用户的兴趣度,从而提高推荐结果的准确性和召回率,提升用户的满意度。
本发明为达到上述发明目的所采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410797816.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:确定网页页面热点区域的方法及装置
- 下一篇:一种数据同步的方法、装置及系统