[发明专利]基于隐变量模型的用户偏好提取方法在审
申请号: | 201510719818.3 | 申请日: | 2015-10-30 |
公开(公告)号: | CN105205184A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 高艳;岳昆;尹子都;武浩;高仁尚;刘惟一 | 申请(专利权)人: | 云南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平;陈靓靓 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 变量 模型 用户 偏好 提取 方法 | ||
技术领域
本发明属于服务信息推送技术领域,更为具体地讲,涉及一种基于隐变量模型的用户偏好提取方法。
背景技术
随着Web2.0的不断发展和社会媒体的不断普及,电子商务应用中产生了大量的用户对商品的评价数据(简称商品评价数据),其中用户对商品是否给出评分的信息,能够很大程度上反映出用户偏好和兴趣爱好。商品评价数据中,能直接观测得到的部分包括商品本身的属性(例如商品类型、价格、好评率),以及用户对商品的评分。同时,不能直接观测得到的用户偏好,一方面决定了用户对商品的浏览、购买和评价行为;另一方面,用户的这些行为也反映了用户偏好,即用户对特定商品类型的喜好。商品本身的属性、商品评分和用户偏好之间有潜在的相互依赖关系,具有不确定性,如何描述这种依赖关系、并有效表示和计算其中存在的不确定性,是解决实际应用中给定商品本身的属性时提取用户偏好这一问题的关键,进而为商品个性化推荐、用户划分和用户定向等应用提供依据。然而,由于不确定性的存在,使得用户偏好的提取具有更大的难度和相当的挑战。除了商品评价数据外,用户自身也存在年龄、职业等诸多属性,也会对用户偏好产生影响。
贝叶斯网络(BayesianNetwork,BN)是一个带有条件概率表的有向无环图,是不确定性知识表示和推理最有效的工具之一,被广泛应用于数据分析、医疗诊断、经济预测等领域,例如,基于贝叶斯网络可以描述社交网络中用户之间的相互影响,还能描述基因片段之间的相互作用等。目前基于贝叶斯网络的用户偏好提取方法通过分析商品评价数据而建立表达用户偏好的贝叶斯网络,从而提取出用户偏好。现有基于贝叶斯网络的用户偏好提取的支撑技术,都根据商品评价数据来获得用户偏好,并且假定贝叶斯网络能表达商品评价数据中存在的所有依赖关系;但事实上,商品评价数据只包含了描述用户偏好的部分观测数据,很多隐含关系并不容易发现和表达,影响了用户偏好提取的准确性。
隐变量(LatentVariable)用来表示不能直接观测其取值的变量。含有隐变量的贝叶斯网络(简称隐变量模型),是一种能够发现和表示数据中隐含信息的概率图模型。该模型是在贝叶斯网络基础上,基于最大半团(MaximalSemi-Clique)来发现并插入隐变量。显然,可用隐变量表示用户偏好这一商品评价数据中的隐含信息,进而可利用隐变量模型的性质和计算方法来提取用户偏好。然而,公知的隐变量模型的相关研究主要从理论论证的角度出发,关注隐变量的发现与表示,和超在其论文“基于结构EM的隐变量模型学习方法”中提出了一种基于结构EM(ExpectationMaximization,期望最大)算法的隐变量模型学习方法,优化了隐变量模型结构,使其更好地表达变量之间的关系;王秀芳在其论文“具有隐变量的贝叶斯网络结构学习研究”中提出了一种隐变量模型的结构学习方法,基于最大团和因子分析的方法,快速地发现贝叶斯网络中的隐变量。但是以上方法对实际应用关注较少,未给隐变量赋予特定应用的实际含义。张富峥在其论文“基于大规模位置和消费数据的用户行为理解”中以贝叶斯网络为基础,把用户表现出来的时间序列行为表示为能够观察到的显式变量,把用户的猎奇心理特质和效用偏好表示为隐变量,通过模型的生成过程来表示用户的行为模式,但该方法未涉及以商品评价数据为基础来提取用户偏好。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于隐变量模型的用户偏好提取方法,针对商品评价数据中隐含的用户偏好,建立商品属性贝叶斯网络结构,通过计算隐变量模型中各个节点的参数,给定当前商品本身的属性时为用户偏好提取提供更客观、更符合实际的结果。
为实现上述发明目的,本发明基于隐变量模型的用户偏好提取方法,包括以下步骤:
S1:根据需要从商品相关属性中选取N个属性构成属性集合V={X1,X2,…,XN},根据这N个属性的历史数据d构建得到贝叶斯网络的有向无环图结构,并计算贝叶斯网络中每个节点的条件概率表;
S2:对贝叶斯网络搜索得到最大半团;
S3:向最大半团中插入表示用户偏好的隐变量L得到隐变量模型,L=1表示用户喜好,L=0表示用户不喜好;插入隐变量L的具体方法为:首先在最大半团中找到所有存在父亲节点的节点,将隐变量节点作为这些节点的父亲节点;然后找到最大半团中所有没有父亲节点的节点,将这些节点作为隐变量节点的父亲节点;
对隐变量模型进行参数学习,得到隐变量模型中各个节点的条件概率表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510719818.3/2.html,转载请声明来源钻瓜专利网。