[发明专利]融合注意力机制的个性化搜索方法和搜索系统有效
申请号: | 202110399302.0 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113127737B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 暴琳;宋英磊;晋春;盖志强 | 申请(专利权)人: | 江苏科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 常虹 |
地址: | 212003*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 注意力 机制 个性化 搜索 方法 系统 | ||
1.融合注意力机制的个性化搜索方法,其特征在于,包括:
步骤1、收集并获取用户u生成内容,所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分;将文本评论进行向量化,项目图像进行特征提取,获取特征向量;
步骤2、将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D;D中的项目构成集合S,S={(u,xi,Ci,Ti,Gi)},其中xi∈D,Ci为项目xi的类别标签向量,Ti为用户对项目xi文本评论的向量化表示,Gi为项目xi的图像特征向量化表示,i=1,2,…,|D|,|D|表示D中的项目数量;
步骤3、构建融合注意力机制的用户偏好感知模型,所述模型基于深度置信网络,由三层受限玻尔兹曼机组成,其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v1、第二组可见单元v2和第三组可见单元v3,隐藏层为h1;h1作为可见层,与隐藏层h2构成第二层受限玻尔兹曼机;h2作为可见层,与隐藏层h3构成第三层受限玻尔兹曼机;所述融合注意力机制的用户偏好感知模型的参数为θ={θ1,θ2,θ3}={w1,a1,b1,w2,a2,b2,w3,a3,b3};
利用优势项目群体D,采用对比散度学习算法对融合注意力机制的用户偏好感知模型中的第一层受限玻尔兹曼机进行训练,获得其模型参数θ1={w1,a1,b1};
第一层RBM模型训练完成后,当给定隐单元状态时,各可见单元的激活状态条件独立,某项目xi的向量表示[Ci,Ti,Gi]输入可见层,其第一组、第二组和第三组可见单元的激活概率分别为:
其中,a1,j、a1,k和a1,l分别表示第一组、第二组和第三组可见单元偏置;
计算各类多源异构数据的信息熵,项目类别标签的信息熵为:
文本评论向量的信息熵为:
项目图像特征向量的信息熵为:
其中cij表示项目xi的类别标签向量Ci的第j个元素,p(cij)表示RBM1中对应于项目类别标签向量表示的第j个元素的可见单元激活概率;
tik表示用户u对项目xi文本评论向量化表示Ti的第k个元素,p(tik)表示RBM1中对应于用户文本评论向量表示的第k个元素的可见单元激活概率;
gil表示,p(gil)表示项目xi的图像特征向量化表示Gi的第l个元素,p(gil)表示RBM1中对应于项目图像特征向量表示的第l个元素的可见单元激活概率;
其次,计算各类信息熵占总信息熵的比例作为权重因子:
其中H(xi)=H(Ci)+H(Ti)+H(Gi);
将向量Ci、Ti、Gi组合构成项目xi的决策向量Ψi输入v1、v2、v3中各可见单元时,隐藏层h1中各隐单元的激活状态条件独立,第m1个隐单元的激活概率为:
其中,m1=1,2,…,M1,为h1中第m1个隐单元的偏置;v1j为RMB1第一组可见单元v1中第j个可见单元的状态;v2k为RMB1第二组可见单元v2中第k个可见单元的状态;v3lRMB1第三组可见单元v3中第l个可见单元的状态;为w1中的元素值,表示RBM1中第n个可见单元与第m1个隐单元之间的连接权重,n=1,2,…,Φ;表示隐层h1中第m1个隐单元的状态;σ(x)=1/(1+exp(-x))是sigmoid激活函数;
RBM1训练完成后,根据式(9)获取项目xi对应的各隐单元的状态,进而获得用户对于优势项目群体D中各项目的各决策分量的偏好程度,即可见层单元激活概率,作为注意力权重系数atn(xi):
其中表示Ψi作为RBM1可见层各可见单元状态时,隐藏层h1中第m1个隐单元的状态;atn(xi)表示项目xi各决策分量ψin的注意力权重;
将注意力权重系数atn(xi)作为项目xi各决策分量的权重系数,对优势项目群体D中项目xi进行基于注意力机制的编码,编码后表示为xati:
xati=Ψi+atn(xi)×Ψi (12)
将xati输入预训练后的RBM1,得到可见单元激活概率VRBM1(xati):
其中xatn′为xati的第n′个元素;
由RBM1可见单元激活概率VRBM1(xati)进行自注意力机制运算,动态学习项目个体的用户偏好注意力权重向量A(xati):
A(xati)=softmax(a(VRBM1(xati),w1)) (14)
其中,softmax()函数保证所有权重系数之和为1;函数a(VRBM1(xati),w1)衡量了项目xi相对于用户偏好特征的注意力权重系数,计算如下:
a(VRBM1(xati),w1)=VRBM1(xati)·(w1)T (15)
结合用户偏好注意力权重向量A(xati)和项目xi的原始决策向量Ci,Ti,Gi,生成融合注意力机制的项目决策向量:
xi′=A(xati)×Ψi (16)
利用融合注意力机制的项目决策向量xi′构成训练集,对DBN中的RBM1、RBM2、RBM3模型进行逐层训练,训练完成后获得融合注意力机制的基于深度置信网络的用户偏好感知模型及其优化模型参数θ;
步骤4、根据已训练好的融合注意力机制的基于深度置信网络的用户偏好感知模型及其模型参数,建立构建基于用户偏好的分布估计概率模型P(x):
P(x)=[P(ψ1),P(ψ2),…,P(ψn),…,P(ψΦ)] (17)
其中(ψ1,ψ2,…,ψn,…,ψΦ)为项目x的原始决策向量,P(ψn)表示用户对于项目的第n个决策分量的偏好概率;
步骤5、设定种群大小N,利用基于用户偏好的分布估计概率模型P(x),采用分布估计算法生成N个新个体,每个个体为一个项目;第v个新个体的类别标签向量的设置步骤如下:
(5.1)令v=1;
(5.2)生成[0,1]之间的随机数z;如果z≤P(ψj=1),则第v个新个体的类别标签向量的第j个元素为1,否则为0;
(5.3)令v加一,重复步骤(5.2),直至vN;
步骤6、在搜索空间中选择与N个新个体类别标签向量相似度最高的N个项目,构成待推荐项目集合Su;
步骤7、计算待推荐项目集合Su中各项目的适应值
其中,和分别表示待推荐项目集合Su中项目能量函数的最大值和最小值;为项目x*的能量函数,x*∈Su,其计算如下:
其中为项目x*的第n个决策分量;
步骤8、选择Su中适应值最高的前TopN个项目作为搜索结果,TopNN;
随着用户交互式搜索过程的推进和用户行为动态演变,根据当前用户最近的评价数据,更新优势项目群体D,再次训练融合注意力机制的用户偏好感知模型,动态更新提取的用户偏好特征,同时,更新基于用户偏好的分布估计概率模型P(x)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110399302.0/1.html,转载请声明来源钻瓜专利网。