[发明专利]一种基于知识库的推荐方法、系统及装置有效
申请号: | 201710947514.1 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107908654B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 张毅 | 申请(专利权)人: | 广州艾媒数聚信息咨询股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N5/02 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识库 推荐 方法 系统 装置 | ||
1.一种基于知识库的推荐方法,其特征在于,包括以下步骤:
读取用户的资讯阅读记录;
根据资讯阅读记录,获取资讯阅读记录中资讯的标签,得到待分析标签;
根据待分析标签,分析生成推荐列表;
其中,所述的根据待分析标签,分析生成推荐列表,这一步骤具体包括:
根据待分析标签,得到对应的百科搜索关联词列表;
将各待分析标签的百科搜索关联词列表进行取交集处理,得到百科交集关联词;
读取百科交集关联词对应的百科搜索关联词列表,并判断待分析标签是否存在百科交集关联词对应的百科搜索关联词列表中,若是,则将该存在的待分析标签的词频与对应的百科交集关联词的词频进行叠加作为该百科交集关联词的词频;反之,则将该百科交集关联词对应的百科搜索关联词列表进行淘汰,其中,所述词频表示在百科搜索关联词列表中词频;
对资讯中的标签的词频叠加作为权值,并根据各资讯的权值由高到低进行排序,并将资讯加入到临时资讯关联池中,得到推荐列表;
其中,所述百科搜索关联词列表为百科或知识库根据关联词搜索得到的列表。
2.根据权利要求1所述的一种基于知识库的推荐方法,其特征在于:所述的根据待分析标签,分析生成推荐列表,这一步骤还包括:若推荐列表中的资讯数量少于预设的资讯阈值,则获取待分析标签对应的关联词列表和关联组合列表;
根据待分析标签对应的关联词列表和关联组合列表,统计关联词出现比例和关联词组合出现比例;
根据预设的规则,将得到关联词出现比例和关联词组合比例作为对应资讯的权值,对资讯进行排序,并将资讯加入到临时资讯关联池中,得到推荐列表。
3.根据权利要求1所述的一种基于知识库的推荐方法,其特征在于:所述的根据待分析标签,得到对应的百科搜索关联词列表,这一步骤具体包括:
根据待分析标签,在各百科平台搜索库中进行搜索,得到各百科平台的搜索结果;
对得到的各百科平台的搜索结果进行切词处理,得到搜索结果中的词汇,进而得到搜索结果中除去待分析标签以外的词汇作为搜索关联词;
对搜索关联词进行哈希值计算,并分别统计各百科平台的搜索关联词的词频;
将各百科平台的搜索关联词的种类进行交集处理,得到取交集后的搜索关联词;
根据取交集后的搜索关联词,对其词频进行平均数计算,进而建立得到对应的百科搜索关联词列表。
4.根据权利要求2所述的一种基于知识库的推荐方法,其特征在于:所述的获取待分析标签对应的关联词列表和关联组合列表,这一步骤具体包括:
根据待分析标签,在知识库中搜索得到对应的资讯文章;
对得到的资讯文章进行切词处理,生成得到资讯文章的标签,进而得到资讯文章中除去待分析标签以外的标签作为关联词;
对待分析标签和关联词进行哈希值计算,并统计待分析标签和关联词的词频,进而建立得到对应的关联词列表;
将关联词进行两两组合,并统计关联词组合后的出现次数,进而建立得到对应的关联组合列表。
5.根据权利要求2所述的一种基于知识库的推荐方法,其特征在于:所述的关联词出现比例的计算公式为:
关联词出现比例=关联词的词频/待分析标签的词频。
6.根据权利要求2所述的一种基于知识库的推荐方法,其特征在于:所述的关联词组合出现比例的计算公式为:
关联词组合出现比例=关联词组合的出现次数/待分析标签的词频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州艾媒数聚信息咨询股份有限公司,未经广州艾媒数聚信息咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710947514.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:一种定位的方法和装置