[发明专利]一种基于多维度特征的新闻推荐方法在审
申请号: | 202210025279.3 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114357307A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 郭楠;李金辉;高燊;高天寒 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00;G06F16/28 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 特征 新闻 推荐 方法 | ||
本发明公开一种基于多维度特征的新闻推荐方法,方法首先构建新闻特征提取器,提取新闻特征ra,包括新闻类别ID的特征、新闻标题文本聚类的类别特征、新闻标题特征、图像特征;然后构建用户特征处理器,将每篇新闻经过注意力网络得到的注意力权重乘以各自的新闻特征,得到用户特征u,并将用户特征u和新闻特征ra相乘得到每篇新闻的点击概率得分接着构造训练集,定义点击率损失函数,并将多个用户的交互记录输入深度学习的batch中进行深度学习模型的训练;最后采用训练好的深度学习模型,进行首页推荐或个性化推荐。本发明使用了多种特征去提升新闻推荐的精确性和多样性。
技术领域
本发明涉及新闻推荐技术领域,尤其涉及一种基于多维度特征的新闻推荐方法。
背景技术
随着互联网技术的发展和人们生活需求的提高,阅读新闻的用户数量一直在增加,人们对新闻类app的推荐效果也有着越来越高的要求。
专利CN102929928A提出,使用标题和正文内容去得到主题特征向量,然后根据新闻的主题特征向量和用户行为数据去构造新闻模型和用户模型,然后在根据时间特征去进行个性化推荐。虽然一定程度上考虑了多种特征,如标题、正文、时间特征,但在模型中真正用于特征抽取的只有标题和正文,并未真正的体现出多维,提出的时间特征,也只是用于推荐时的一种策略筛选,且用户在点击新闻时一般是先看到标题,才去看正文的,并未符合人们的阅读习惯。
专利CN111061856A提出,从新闻文本中识别出实体,将其与知识图谱中的实体相匹配,利用知识表示学习模型得到实体和关系的向量表示,用卷积神经网络融合新闻的词向量和实体向量,从中学习新闻的特征,以注意力机制去得到用户特征,再将候选新闻特征、用户特征和路径特征为输入,使用多层感知机计算候选新闻的点击概率,最终实现个性化推荐。该发明提出的使用知识图谱中的实体和关系,虽然在AUC和F1上有很好的提升,但是在实际工程中,并不是所有的新闻app,都会事先去搭建知识图谱,如果知识图谱没有建立或者过于稀疏,那么推荐效果就会降低。
由于上述技术方案均不能满足人们对新闻阅读推荐问题的需求,因此提出一种新的推荐方法是有必要的。
发明内容
针对上述现有技术的不足,本发明提供一种基于多维度特征的新闻推荐方法。
为解决上述技术问题,本发明所采取的技术方案是:一种基于多维度特征的新闻推荐方法,具体过程如下:
步骤1:构建新闻特征提取器,提取新闻特征ra,过程如下:
步骤1.1:获取新闻,从新闻标题的文本中提取实体信息和关系信息,构建知识图谱;并从构建的知识图谱中学习实体向量和关系向量,计算每个实体的上下文向量的平均值,具体过程如下:
步骤1.1.1:基于命名实体识别技术对新闻标题进行实体抽取,将抽取得到的实体组合成新闻实体集合;
步骤1.1.2:将新闻标题和对应的实体输入到PCNN中进行关系抽取,形成三元组(h,r,t);其中,h为头部实体、t为尾部实体,h和t均来自新闻实体集合,r为关系,由PCNN抽取后得到;
步骤1.1.3:以三元组(h,r,t)为基础构建知识图谱;
步骤1.1.4:使用知识图谱特征学习方法,从构建的知识图谱中学习实体向量和关系向量;
步骤1.1.5:提取每个实体的上下文信息,即获取每个实体在图谱中的邻居,并计算每个实体的上下文向量的平均值。
具体计算公式如下:
context(e)={ei|(e,r,ei)∈G or(ei∈G)}
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210025279.3/2.html,转载请声明来源钻瓜专利网。