[发明专利]一种面向网络用户的个性化文本排序及推荐方法有效
申请号: | 201410514028.7 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104298732B | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 程学旗;杜慧;张瑾;黄康平;余智华;刘悦;刘玮 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种面向网络用户的个性化文本排序及推荐方法,所述个性化文本排序方法包括对于用户的每条包括具有关键词和运算符的表达式的兴趣规则,执行以下步骤1)、对于多个文本中的每个文本提取关键词和该关键词在该文本中的权重。2)、对于所述多个文本中的每个文本,计算该文本与该兴趣规则对应的表达式树的相似度;其中,表达式树是根据兴趣规则中包括的表达式建立的,表达式树中的节点分为运算符节点和文本节点,文本节点包括关键词和该关键词在该兴趣规则中的权重。3)、根据与所述表达式树的相似度大小,对所述多个文本中的每个文本进行排序。本发明能够在稀疏用户行为的场景下有效地将符合个性化需求的文本信息推荐给用户。 | ||
搜索关键词: | 一种 面向 网络 用户 个性化 文本 排序 推荐 方法 | ||
【主权项】:
一种面向网络用户的个性化文本排序方法,对于用户的每条包括具有关键词和运算符的表达式的兴趣规则,所述方法包括以下步骤:步骤1)、对于多个文本中的每个文本提取关键词和该关键词在该文本中的权重;步骤2)、对于所述多个文本中的每个文本,计算该文本与该兴趣规则对应的表达式树的相似度;其中,表达式树是根据该兴趣规则中包括的表达式建立的,表达式树中的节点分为运算符节点和文本节点,文本节点包括关键词和该关键词在该兴趣规则中的权重;步骤3)、根据与所述表达式树的相似度大小,对所述多个文本中的每个文本进行排序;其中,步骤2)包括:对于所述多个文本中的每个文本,后序遍历与该兴趣规则对应的表达式树,在遍历时根据如下方式计算每个节点的相似度分值:如果该节点N是文本节点,则其相似度分值计算如下:f(N)=g(T(N))其中,T(N)表示节点N中的关键词,g(T(N))表示关键词T(N)在该兴趣规则中的权重;如果该节点N是“&”运算符节点,则其相似度分值计算如下:f(N)=1-(Σi=1mfP(Ni)(1-w(T(Ni))p+Σi=m+1KfP(Ni)Σi=1KfP(Ni))1p]]>其中,N1,…,NK表示节点N的子节点并且前m个是文本节点,p为正整数,T(Ni)表示节点Ni中的关键词,w(T(Ni))表示关键词T(Ni)在该文本中的权重,其中如果T(Ni)不是该文本中的关键词,则w(T(Ni)=0;如果该节点N是“|”运算符节点,则其相似度分值计算如下:f(N)=(Σi=1mfP(Ni)wp(T(Ni))+Σi=m+1KfP(Ni)Σi=1KfP(Ni))1p]]>其中,N1,…,NK表示节点N的子节点且前m个是文本节点,并且其中前m个是文本节点;如果该节点N是“‑”运算符节点,则其相似度分值计算如下:f(N)=1‑f(N1)其中,N1为节点N的子节点;在得到根节点的相似度分值后,将该根节点的相似度分值作为该文本与所述表达式树的相似度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410514028.7/,转载请声明来源钻瓜专利网。