本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,包括:1、获取用户u的历史评价数据,包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;2、将评分大于预设评分阈值的项目组成优势项目集合D
1.基于受限玻尔兹曼机驱动的交互式个性化搜索方法,其特征在于,包括:(1)获取用户u的历史评价数据,所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;(2)将评分大于预设评分阈值的项目组成优势项目集合Du,构成样本集其中xi∈Du,为项目xi的类别标签向量,长度为类别总数n1;为用户u对项目xi的评价文本向量化表示,长度为n2;i=1,2,…,|Du|,|Du|表示Du中的项目数目;(3)构建基于受限玻尔兹曼机的用户偏好特征提取模型,所述用户偏好特征提取模型用于根据优势项目集合Du提取用户的偏好特征;(4)构建用户偏好概率模型,所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率;(5)设定种群大小N,采用分布估计算法生成N个新项目并设置每个项目的类别标签;(6)在搜索空间中选取分别与N个新项目类别标签向量相似度最高的N个项目,构成待推荐项目集合Su;(7)计算待推荐项目集合Su中每个项目的适应值:(7.1)估计用户u对Su中每个项目的个性化偏好评分其中,Eθ(x|u*)为与当前用户u相似度大于阈值的用户u*对项目x的评价能量函数;max(Eθ)和min(Eθ)分别为待推荐项目集合Su的所有项目中获得的能量函数的最大和最小值;(7.2)计算Su中每个项目的适应值:其中σ(x)=1/(1+exp(-x))是归一化函数;(8)选择Su中适应值最大的前TOPN个项目作为搜索结果;所述用户偏好特征提取模型包括第一可见层、第二可见层、隐藏层;所述第一可见层有n1个可见单元,每个可见单元为二值变量;第二可见层有n2个可见单元,每个可见单元为实数;所述隐藏层有m个隐单元,每个隐单元为实数;所述用户偏好特征提取模型的参数为θ={w1,a1,w2,a2,b},其中,w1、w2分别表示第一可见层中可见单元与隐藏层中隐单元、第二可见层中可见单元与隐藏层中隐单元之间的连接权重;a1、a2分别为第一可见层中可见单元、第二可见层中可见单元的偏置;b为隐藏层中隐单元的偏置;将样本集中每个样本的和输入到用户偏好特征提取模型的第一可见层和第二可见层,采用对比散度学习算法对所述模型进行训练,优化模型参数θ,得到训练好的用户偏好特征提取模型;所述用户偏好概率模型为:其中p(cj=1)表示用户u偏好的项目具有第j类标签项目的概率;用户u*对项目x的评价能量函数Eθ(x|u*)的计算式为:其中cj为x类别标签向量中第j个元素;tk为用户u*对x的评价文本向量化的第k个元素;为用户偏好特征提取模型中第一可见层中可见单元的偏置a1的第j个元素;为用户偏好特征提取模型中第二可见层中可见单元的偏置a2的第k个元素;bl为用户偏好特征提取模型中隐藏层中隐单元的偏置b的第l个元素;为第一可见层中第j个可见单元与隐藏层中第l个隐单元之间的连接权重,为第二可见层中第k个可见单元与隐藏层中第l个隐单元之间的连接权重;所述步骤(5)中新项目的类别标签向量的设置步骤如下:(5.1)令n=1;(5.2)生成[0,1]之间的随机数z;如果z≤p(cj=1),则第n个新项目的类别标签向量的第j个元素为1,否则为0;(5.3)令n加一,重复步骤(5.2),直至nN;随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,再次训练融合了多源异构数据的基于受限玻尔兹曼机的用户偏好特征提取模型,动态更新提取的用户偏好特征,同时,更新用户偏好概率模型。
本文链接:http://www.vipzhuanli.com/tech/sell/s_2278952.html,转载请声明来源钻瓜专利网。