[发明专利]一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统有效
申请号: | 201710480529.1 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107357835B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 张可;王鹏;谢文 | 申请(专利权)人: | 电子科技大学;东莞市慧眼数字技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/30 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 遗忘 规律 兴趣 预测 挖掘 方法 系统 | ||
本发明公开了一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统,涉及社交用户的兴趣预测领域;其方法包括:用户的兴趣周期性发现、用户的兴趣预测;一种基于主题模型和遗忘规律的兴趣预测挖掘系统,包括:兴趣周期性发现模块、用户的兴趣预测模块和数据显示模块。本发明实现社交网络中用户信息文本主旨的挖掘和用户兴趣的挖掘预测,并能够发现和预测用户兴趣爱好的走势,这对于网站的推荐效果将会有很大的提升,具有极高的商业应用价值。
技术领域
本发明涉及社交用户的兴趣预测领域,尤其是一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统。
背景技术
LDA(Latent Dirichlet Allocation)是一种文档主题模型,它是一种发掘文档表达思想的主题模型,这个模型最终将文章所包含的多个语义以概率分布的形式呈现在结果中。艾宾浩斯遗忘曲线是由德国心理学家艾宾浩斯(H.Ebbinghaus)研究发现的,曲线表示了人记忆的规律,人们可以利用这个曲线,提升自己的记忆能力。
社交网络(Social Network)是人寄托和表达自己情感的地方,同时通过社交网络可以结交很多朋友。人们在社交网络上进行着内容的产生,同时也结交着兴趣相投的朋友。由于人们在社交网络中发掘朋友的能力有限,目前在社交网络中,进行好友推荐是由社交网站负责,并且如何更好的提升推荐准确度一直是社交网站的工作重点。此外,社交网站由于盈利的需要,也需要向用户推荐他可能感兴趣的事物,因此,获得用户的兴趣所在也是社交网络的关注点。
LDA(Latent Dirichlet Allocation)作为一个主题发掘模型可以很好的发现用户所要表达的主旨。
艾宾浩斯遗忘曲线作为一个记忆遗忘规律曲线,由于用户的兴趣可以作为用户的一个记忆,因此可以利用艾宾浩斯遗忘曲线很好的发现用户某时刻很感兴趣的兴趣爱好。
由于记忆有着记忆的周期。因此,获得用户的兴趣周期,并在此基础上进行用户兴趣的挖掘,对接下来进行的好友推荐和兴趣针对推荐有着重要意义。
但在现在的社交网络中,在给用户推荐好友时,多是依靠用户之间的联系(即共同好友)和用户提及的关键字。由于用户文本信息的内容多样性,可能文本的主旨和关键字有着偏差。并且现在的推荐算法在向用户推荐感兴趣的事物时过多的在意用户当前关注的点,而忽视了用户一直存在的兴趣爱好和可能潜在的兴趣爱好。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统,实现社交网络中用户信息文本主旨的挖掘和用户兴趣的挖掘预测,并能够发现和预测用户兴趣爱好的走势,这对于网站的推荐效果将会有很大的提升,具有极高的商业应用价值。
本发明的目的是通过以下技术方案来实现的:一种基于主题模型和遗忘规律的兴趣预测挖掘方法,它具体包括如下步骤:
S001用户的兴趣周期性发现:确定待测事件,通过该事件发生后的关注度的走势曲线得到兴趣周期,即用户兴趣的产生周期天数;
S002用户的兴趣预测:将用户最近的用户文档以兴趣周期为分段间隔分为N个周期文档,以最近一个兴趣周期的用户文档为数据基础建立LDA主题模型,将N个兴趣周期的用户文档输入已建立的主题模型,并获得主题模型上的概率分布,对N个兴趣周期的概率分布进行加权处理,对最终结果进行加权并得到最终预测的兴趣概率。
进一步的,所述的步骤S002具体包括如下子步骤:
S201确定用户兴趣周期的天数;
S202确定遗忘曲线记忆时间为N个阶段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;东莞市慧眼数字技术有限公司,未经电子科技大学;东莞市慧眼数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710480529.1/2.html,转载请声明来源钻瓜专利网。