[发明专利]一种基于超图排序的新闻推荐方法有效
申请号: | 201410299211.X | 申请日: | 2014-06-27 |
公开(公告)号: | CN104090936B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 董守斌;古万荣;袁华 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 超图 排序 新闻 推荐 方法 | ||
1.一种基于超图排序的新闻推荐方法,其特征在于,包括以下步骤:
1)预处理
主要处理分类问题和命名实体抽取问题,利用已有的分类标注新闻语料,将用户历史阅读的新闻以及待推荐的新出版新闻进行分类,同时,使用NLP开源工具GATE进行命名实体抽取,使新闻语料具有命名实体关联集;
2)超图构建
定义超图模型中的点、边及其相关的权重;
3)矩阵构建
超图排序所需的矩阵构建,主要有H矩阵、De矩阵、Dv矩阵、W矩阵,其中:
H矩阵是超图中的“点-边”关联矩阵,每个元素是h(v,e),如果点v和超边e关联,则h(v,e)=1,否则h(v,e)=0;
De矩阵是由所有超边e的度构成的对角矩阵,矩阵中的对角线元素值是每个超边的度,其余元素的值为0,超边e的度数δ(e)=|e|,即超边中包含的节点度数;
Dv矩阵是由所有节点v的度构成的对角矩阵,矩阵中的对角线元素值是每个节点的度,其余元素的值为0,节点v的度数即节点v所关联的所有边的权重之和;
W矩阵是一个|E|×|E|的对角矩阵,其中对角元素是每条超边的权重,其余元素是0;
4)排序
定义一个代价函数,并最小化该代价函数来求得新闻文章的排序分数,该代价函数定义如下:
式中,d(vi)表示vi节点的度数,fi表示第i个元素的排序得分,w(e)表示超边e的权重,μ是正则化参数,yi是第i个元素初始化的排序得分,δ(e)是e的度数,即超边e包含的节点数;该代价函数的含义在于,如果两个节点同时处于较多相同的超边之内,则这两个节点的排序得分应该是近似的,对代价函数进行f向量的求偏导数,并使偏导数公式等于0,即可求得最优解:
f*=(I-αA)-1y
式中,I是单位矩阵,
5)获得排序结果
根据步骤4)提供的公式,代入相关的函数公式,获得f*的运算向量结果;
6)获得推荐结果
由于f*向量包含了超图模型中的所有元素,因此,需要对专门的“待推荐新闻集合”进行抽取,即对f*向量中,只提取对应的待推荐新闻所对应的向量的排序得分,然后取前n个新闻作为Topn推荐列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410299211.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库审计系统及其审计方法
- 下一篇:一种实现数字内容跨终端出版的系统