[发明专利]一种适应用户兴趣变化的媒体文章推荐方法在审
申请号: | 201710597163.6 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107491491A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 李庆;王佳 | 申请(专利权)人: | 西南财经大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 611130 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适应 用户 兴趣 变化 媒体 文章 推荐 方法 | ||
技术领域
本发明涉及一种信息推荐方法,尤其涉及一种适应用户兴趣变化的媒体文章推荐方法。
背景技术
随着互联网的发展,社会化媒体的出现使得用户不仅是网络内容的浏览者,也是网络内容的制造者。它的发展进一步加剧了网络时代的信息爆炸。现有的推荐系统通过让用户回答问题或者主动定制的方式来获取用户的兴趣,进而实现推荐。然而,用户的兴趣不是一成不变的,它会随着时间的推移而变化。社会化媒体形式多样,如论坛、博客、内容社区、社交网络等。在这些形式下,用户可以发布或者转帖一篇文章,其他用户可以对其阅读或评论,这些评论本身又会被其他用户阅读或评论。从用户评论中,可以观察出用户当前感兴趣的话题。现有的基于内容的推荐方法一般根据原文的内容信息、来推荐相关文章。然而,随着用户讨论的继续,讨论的主题也会发生变化,即用户兴趣也会发生变化。这时,如果仅仅依据原文本体进行推荐,则返回的文章往往不是用户当前最感兴趣的,从而会降低用户的满意度。
此外,事件报道在网络上的传播,具有转载重合、报道重合、包含重合和追踪重合等特点,使基于内容的推荐系统存在严重的重复推荐问题,即推荐文章的内容与原文含有相同的信息,这样会增加用户的阅读负担。
发明内容
本发明的目的在于克服现有技术的不足,提出了一种适应用户兴趣变化的媒体文章推荐方法,并通过分析推荐文章与原文章的逻辑关系,去除重复的文章,减轻用户负担,推荐出符合用户需求的文章。
为达到上述目的,本发明采用如下技术方案:
提供一种适应用户兴趣变化的媒体文章推荐方法,具体包括:
S1、收集文章及评论信息;
具体地,通过网页爬虫技术抓取网页,利用网页解析技术从获取网页中抽取出文章标题、正文、读者评论、以及评论之间的引用和回复关系等。
S2、分析评论信息,计算评论的权值;
本发明中,每条评论对推荐结果的影响不一致,有些评论对原文内容有深刻的见解,而有些评论是无意义的讨论。因此,本发明根据抽取的评论间关系以计算每条评论对推荐的不同影响。
S21、构建原文与评论间的关系模型;
其中,原文与评论间的关系模型包括内容语义相似性模型和逻辑关系模型。
具体地,构建内容语义相似性模型时,构建的关系模型为:GC=(V,EC),V为文本结点,EC为结点间边的集合。结点v到结点u间则有一条弧,弧上的权值是文档间的相似性。
可选地,节点u与v的相似性计算方式如下:
其中,wk(u)为词语k在文本u中的权重,wk(v)为词语k在文本v中的权重,n为词条总数,权重wk(u)为:
其中,numi,u是文本u中词条ti的出现次数,是文本u中所有词条出现的次数之和,|D|为文档总数,|j:ti∈dj|为包含词条ti的文档和。
具体地,构建逻辑关系模型时,原文本体、相关评论为关系模型中的文本结点,结点间的逻辑关系包括回复关系和引用关系。一条评论可能从其它评论中引用其内容信息。其中回复关系包对原文本体的回复或对另一评论的回复。
基于回复关系构建关系模型时,构建的关系模型为:GT=(V,ET),V为文本结点,ET为结点间边的集合。如果评论u对评论或原文v进行回复,结点v到结点u间则有一条弧eT=(v,u),eT∈ET。可选地,弧上的权值为1,可选地,原文本体是根结点,所有的评论是普通结点。
基于引用关系构建模型时,构建的关系模型为:GD=(V,ED),V为文本结点,ED为结点间边的集合。如果一条评论u引用了评论v中的内容,从结点v到结点u则有一条弧eD=(v,u),eD∈ED。可选地,弧上的权值取1。
S22、根据构建的关系模型计算评论的原始权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南财经大学,未经西南财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710597163.6/2.html,转载请声明来源钻瓜专利网。