[发明专利]融合注意力机制的个性化搜索方法和搜索系统有效

申请号：	202110399302.0	申请日：	2021-04-14
公开（公告）号：	CN113127737B	公开（公告）日：	2021-09-14
发明（设计）人：	暴琳;宋英磊;晋春;盖志强	申请（专利权）人：	江苏科技大学
主分类号：	G06F16/9535	分类号：	G06F16/9535;G06K9/62;G06N3/04;G06N3/08
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	常虹
地址：	212003***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	融合注意力机制个性化搜索方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.融合注意力机制的个性化搜索方法，其特征在于，包括：

步骤1、收集并获取用户u生成内容，所述用户生成内容包括用户u已评价的所有项目、对每个项目的评分和文本评论、每个项目的图像、其他用户对用户u所做评价的有用性评价得分；将文本评论进行向量化，项目图像进行特征提取，获取特征向量；

步骤2、将用户评分大于预设评分阈值且信任度大于预设信任度阈值的项目组成含用户偏好的优势项目群体D；D中的项目构成集合S，S＝{(u,x_i,C_i,T_i,G_i)}，其中x_i∈D，C_i为项目x_i的类别标签向量，T_i为用户对项目x_i文本评论的向量化表示，G_i为项目x_i的图像特征向量化表示，i＝1,2,…,|D|，|D|表示D中的项目数量；

步骤3、构建融合注意力机制的用户偏好感知模型，所述模型基于深度置信网络，由三层受限玻尔兹曼机组成，其中第一层受限玻尔兹曼机的可见层包括第一组可见单元v₁、第二组可见单元v₂和第三组可见单元v₃，隐藏层为h₁；h₁作为可见层，与隐藏层h₂构成第二层受限玻尔兹曼机；h₂作为可见层，与隐藏层h₃构成第三层受限玻尔兹曼机；所述融合注意力机制的用户偏好感知模型的参数为θ＝{θ₁,θ₂,θ₃}＝{w₁,a₁,b₁,w₂,a₂,b₂,w₃,a₃,b₃}；

利用优势项目群体D，采用对比散度学习算法对融合注意力机制的用户偏好感知模型中的第一层受限玻尔兹曼机进行训练，获得其模型参数θ₁＝{w₁,a₁,b₁}；

第一层RBM模型训练完成后，当给定隐单元状态时，各可见单元的激活状态条件独立，某项目x_i的向量表示[C_i,T_i,G_i]输入可见层，其第一组、第二组和第三组可见单元的激活概率分别为：

其中，a_1,j、a_1,k和a_1,l分别表示第一组、第二组和第三组可见单元偏置；

计算各类多源异构数据的信息熵，项目类别标签的信息熵为：

文本评论向量的信息熵为：

项目图像特征向量的信息熵为：

其中c_ij表示项目x_i的类别标签向量C_i的第j个元素，p(c_ij)表示RBM1中对应于项目类别标签向量表示的第j个元素的可见单元激活概率；

t_ik表示用户u对项目x_i文本评论向量化表示T_i的第k个元素，p(t_ik)表示RBM1中对应于用户文本评论向量表示的第k个元素的可见单元激活概率；

g_il表示，p(g_il)表示项目x_i的图像特征向量化表示G_i的第l个元素，p(g_il)表示RBM1中对应于项目图像特征向量表示的第l个元素的可见单元激活概率；

其次，计算各类信息熵占总信息熵的比例作为权重因子：

其中H(x_i)＝H(C_i)+H(T_i)+H(G_i)；

将向量C_i、T_i、G_i组合构成项目x_i的决策向量Ψ_i输入v₁、v₂、v₃中各可见单元时，隐藏层h₁中各隐单元的激活状态条件独立，第m₁个隐单元的激活概率为：

其中，m₁＝1,2,…,M₁，为h₁中第m₁个隐单元的偏置；v_1j为RMB1第一组可见单元v₁中第j个可见单元的状态；v_2k为RMB1第二组可见单元v₂中第k个可见单元的状态；v_3lRMB1第三组可见单元v₃中第l个可见单元的状态；为w₁中的元素值，表示RBM1中第n个可见单元与第m₁个隐单元之间的连接权重，n＝1,2,…,Φ；表示隐层h₁中第m₁个隐单元的状态；σ(x)＝1/(1+exp(-x))是sigmoid激活函数；