[发明专利]一种基于随机游走和条件随机场的社会标签推荐方法有效
申请号: | 201810160496.7 | 申请日: | 2018-02-27 |
公开(公告)号: | CN108427730B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 薛安荣;夏欢欢;曹静 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 游走 条件 社会 标签 推荐 方法 | ||
本发明提出了一种基于随机游走和条件随机场的社会标签推荐方法,标签推荐数据经过数据抽取,抽取出用户标签、资源标签数据;利用基于随机游走的多标签分类算法预测资源可能被标记的标签概率,该过程有效利用资源本身具有的特征,降低了因用户标注导致的标签噪声的影响;以预测资源可能被标记的标签概率设计点特征函数,标签共现率、用户相似度设计边特征函数,构造条件随机场,获得用户为资源可能添加的标签,选择大于阈值的标签作为推荐标签,该过程有效利用用户、资源、标签三维关系,降低了因将社会标签推荐三维关系转化为二维关系造成的有效信息的损失。本发明提高了标签推荐的质量,帮助用户更好的查找和定位社会资源。
技术领域
本发明涉及数据挖掘与推荐系统应用领域,具体涉及一种基于随机游走和条件随机场的社会标签推荐方法。
背景技术
信息技术的飞速发展带来了信息过载问题,给用户的信息选择带来了沉重的负担。为了解决信息过载问题,人们引入了推荐系统方法。随着Web2.0技术的发展,越来越多的网络用户能够自由的选择标签标注网络资源,形成了社会化标签。标签既能够描述资源,也表示了用户对资源的偏好。
在标签推荐系统中,社会标签推荐的任务是给定用户和资源,为用户推荐一系列其可能为该资源添加的标签。现有的多数标签推荐方法将社会标签三维关系转化为二维关系,直接应用传统推荐模型,导致在标签推荐过程中未充分利用用户资源标签三维关系,造成了标签推荐质量的降低。一个资源往往会被多个用户标注多个标签,但是由于用户对资源了解程度和偏好的不同,造成标签信息中包含了噪音,如能将资源本身具有的特征和标签建立关联,关注标签自身特征对标签的影响。随着多标签技术的发展,其在规则挖掘,生物基因功能、中医证型分类中的应用前景巨大。而一个资源可能对应多种标签,将资源作为实例,标签作为类别,则可将标签推荐问题转化成多标签分类问题。为了提高标签推荐系统的质量,需充分挖掘用户、资源网络数据,标签间相关性等信息。
发明内容
本发明的目的在于提出一种基于随机游走和条件随机场的社会标签推荐方法,该方法充分利用用户、资源、标签三维关系和资源本身具有的特征对标签推荐的影响,降低了将社会标签的三维关系转换为二维关系以及因用户造成的标签噪音对推荐质量的影响,提高标签推荐的准确度。
本发明具体技术方案如下:
一种基于随机游走和条件随机场的社会标签推荐算法,包括以下步骤:
步骤1,构造基于资源的多标签随机游走模型。标签数据中的实例通常由用户、资源、标签构成,抽取出关于资源和标签的数据,根据该数据构造基于资源的随机游走模型,该模型可以充分利用资源特征,推荐可能标签,降低了因用户导致的标签噪声问题。
步骤2,设计以标签共现率、用户相似度为边特征函数和标签预测概率为点特征函数的条件随机场。
步骤3,估计条件随机场的参数。依据步骤2,估计条件随机场的参数,获得条件随机场的各个参数值。
步骤4,基于条件随机场的社会标签推荐。依据步骤2获得的特征函数,步骤3获得的参数值,建立条件随机场,获得指定用户与资源的可能推荐标签,该方法能够有效利用资源、用户和标签之间的潜在联系,推荐可能标签。
进一步地,所述步骤1中,构建基于资源的多标签随机游走模型包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810160496.7/2.html,转载请声明来源钻瓜专利网。