[发明专利]一种基于超图排序的新闻推荐方法有效

专利信息
申请号: 201410299211.X 申请日: 2014-06-27
公开(公告)号: CN104090936B 公开(公告)日: 2017-02-22
发明(设计)人: 董守斌;古万荣;袁华 申请(专利权)人: 华南理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州市华学知识产权代理有限公司44245 代理人: 蔡茂略
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 超图 排序 新闻 推荐 方法
【权利要求书】:

1.一种基于超图排序的新闻推荐方法,其特征在于,包括以下步骤:

1)预处理

主要处理分类问题和命名实体抽取问题,利用已有的分类标注新闻语料,将用户历史阅读的新闻以及待推荐的新出版新闻进行分类,同时,使用NLP开源工具GATE进行命名实体抽取,使新闻语料具有命名实体关联集;

2)超图构建

定义超图模型中的点、边及其相关的权重;

3)矩阵构建

超图排序所需的矩阵构建,主要有H矩阵、De矩阵、Dv矩阵、W矩阵,其中:

H矩阵是超图中的“点-边”关联矩阵,每个元素是h(v,e),如果点v和超边e关联,则h(v,e)=1,否则h(v,e)=0;

De矩阵是由所有超边e的度构成的对角矩阵,矩阵中的对角线元素值是每个超边的度,其余元素的值为0,超边e的度数δ(e)=|e|,即超边中包含的节点度数;

Dv矩阵是由所有节点v的度构成的对角矩阵,矩阵中的对角线元素值是每个节点的度,其余元素的值为0,节点v的度数即节点v所关联的所有边的权重之和;

W矩阵是一个|E|×|E|的对角矩阵,其中对角元素是每条超边的权重,其余元素是0;

4)排序

定义一个代价函数,并最小化该代价函数来求得新闻文章的排序分数,该代价函数定义如下:

Q(f)=12Σi,j=1|V|ΣeE1δ(e)Σ{vivj}ew(e)||fid(vi)-fjd(vj)||2+μΣi=1|V|||fi-yi||2]]>

式中,d(vi)表示vi节点的度数,fi表示第i个元素的排序得分,w(e)表示超边e的权重,μ是正则化参数,yi是第i个元素初始化的排序得分,δ(e)是e的度数,即超边e包含的节点数;该代价函数的含义在于,如果两个节点同时处于较多相同的超边之内,则这两个节点的排序得分应该是近似的,对代价函数进行f向量的求偏导数,并使偏导数公式等于0,即可求得最优解:

f*=(I-αA)-1y

式中,I是单位矩阵,A=Dv-12HWDe-1HTDv-12,]]>其中每个矩阵元素都可以在步骤3)中求解,y向量的维度是所有元素的总量,关于y向量的赋值,其对应的用户,即如需对某特定用户形成推荐列表,则对该当前用户所对应的分量赋值为1,其它分量有三种情况:分类点、新闻文章、命名实体;①分类点,对应分量的取值为对该分类点的访问占所有历史文章访问的比例,②新闻文章,有关联的则取值为1,如果没有关联,或该文章是待推荐新闻,则取值为0,③命名实体,有关联的则取值为1,如果没有关联,则取值为0;

5)获得排序结果

根据步骤4)提供的公式,代入相关的函数公式,获得f*的运算向量结果;

6)获得推荐结果

由于f*向量包含了超图模型中的所有元素,因此,需要对专门的“待推荐新闻集合”进行抽取,即对f*向量中,只提取对应的待推荐新闻所对应的向量的排序得分,然后取前n个新闻作为Topn推荐列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410299211.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top