[发明专利]一种基于多维度特征的新闻推荐方法在审
申请号: | 202210025279.3 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114357307A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 郭楠;李金辉;高燊;高天寒 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00;G06F16/28 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 特征 新闻 推荐 方法 | ||
1.一种基于多维度特征的新闻推荐方法,其特征在于,包括如下步骤:
步骤1:构建新闻特征提取器,提取新闻特征ra;
步骤2:构建用户特征处理器,将每篇新闻经过注意力网络得到的注意力权重乘以各自经过步骤1的新闻特征提取器提取得到的新闻特征,得到用户特征u;
步骤3:将用户特征u和新闻特征ra相乘得到每篇新闻的点击概率得分
步骤4:随机从多个用户的交互记录中抽取K篇用户未点击的新闻作为负样本,抽取一篇用户点击过的新闻作为正样本,所有的用户数据组合在一起构成训练集,计算训练集正样本的点击概率得分pi,并定义点击率损失函数L;
步骤5:将多个用户的交互记录输入深度学习的batch中,重复执行步骤1至步骤4进行深度学习模型的训练;
步骤6:将用户历史浏览新闻和候选新闻输入步骤5训练好的深度学习模型中,进行首页推荐或个性化推荐。
2.根据权利要求1所述的基于多维度特征的新闻推荐方法,其特征在于,所述步骤1的过程如下:
步骤1.1:获取新闻,从新闻标题的文本中提取实体信息和关系信息,构建知识图谱;并从构建的知识图谱中学习实体向量和关系向量,计算每个实体的上下文向量的平均值;
步骤1.2:获得新闻标题中每个词的词向量,与实体向量和实体的上下文向量的平均值一同映射到相同维度的向量空间中,并输入到动态多卷积核CNN中进行特征提取,得到相应的词特征、实体特征和实体上下文特征;
步骤1.3:分别计算步骤2得到的词特征、实体特征、实体上下文特征相应的权重值,并分别乘以对应的词特征、实体特征和实体上下文特征,然后相加得到最终的标题特征rt;
步骤1.4:使用k-means均值聚类算法对新闻标题的文本进行聚类分析,获取聚类后的质心,并将k个质心对应到k个类别,得到新闻标题文本聚类的类别特征表示rcq;
步骤1.5:从新闻中获取一幅配图,对图像进行转化得到RGB图,将RGB图像颜色空间转换到HSV颜色空间,并对其中的色调H、饱和度S和亮度V进行计算,得到图像的颜色特征;
步骤1.6:对于每幅图像f(x,y)计算其几何不变矩,并使用几何不变矩来描述图像的形状特征;
步骤1.7:对于每幅图像f(x,y)计算其灰度共生矩阵,并使用灰度共生矩阵来描述图像的纹理特征;
步骤1.8:分别计算每一张新闻图像的颜色、形状和纹理特征的特征相似度,并根据特征相似度计算结果动态调整阈值,建立每一张新闻图像特征的知识图谱子图,把所有知识图谱子图链接到一起,得到新闻图像特征的知识图谱;
步骤1.9:将图像的颜色、形状和纹理特征表示为知识图谱中的头实体向量和尾实体向量,特征之间的相似度表示为关系向量,将头实体向量、尾实体向量和关系向量使用TransE0模型进行过滤;
步骤1.10:将图像的颜色、形状和纹理特征进行线性融合得到图像的特征向量D;
步骤1.11:获取新闻类别ID,并获取该类别ID所对应的初始特征,将初始特征输入到Dense中得到新闻类别ID的特征表示rca;
步骤1.12:将新闻类别ID的特征rca、新闻标题文本聚类的类别特征rcq、新闻标题特征rt、图像特征D用注意力机制融合在一起,作为最终的新闻特征ra。
3.根据权利要求2所述的基于多维度特征的新闻推荐方法,其特征在于,所述步骤1.1的过程如下:
步骤1.1.1:基于命名实体识别技术对新闻标题进行实体抽取,将抽取得到的实体组合成新闻实体集合;
步骤1.1.2:将新闻标题和对应的实体输入到PCNN中进行关系抽取,形成三元组(h,r,t);其中,h为头部实体、t为尾部实体,h和t均来自新闻实体集合,r为关系,由PCNN抽取后得到;
步骤1.1.3:以三元组(h,r,t)为基础构建知识图谱;
步骤1.1.4:使用知识图谱特征学习方法,从构建的知识图谱中学习实体向量和关系向量;
步骤1.1.5:提取每个实体的上下文信息,即获取每个实体在图谱中的邻居,并计算每个实体的上下文向量的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210025279.3/1.html,转载请声明来源钻瓜专利网。