[发明专利]一种基于知识库的推荐方法、系统及装置有效
申请号: | 201710947514.1 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107908654B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 张毅 | 申请(专利权)人: | 广州艾媒数聚信息咨询股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N5/02 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识库 推荐 方法 系统 装置 | ||
本发明公开了一种基于知识库的推荐方法、系统及装置,包括读取用户的资讯阅读记录;根据资讯阅读记录,获取资讯阅读记录中资讯的标签,得到待分析标签;根据待分析标签,分析生成推荐列表。本发明通过实时分析用户的资讯阅读记录,并在知识库和百科平台搜索库中进行分析,得到词与词之间的关系链,从而在资讯推荐过程中能够更好的处理优先级、相关性的问题,有效提高推荐的准确率,可广泛应用于资讯推荐应用中。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于知识库的推荐方法、系统及装置。
背景技术
推荐理论中,有一种理论方法叫基于知识库的推荐方法,主要是处理词与词之间关系强弱问题,目前没有开放的接口或系统提供这种服务,要使用这个推荐方法,必须搭建、维护一套知识库网络,然而现在的知识库网络中词汇之间的关系链比较薄弱,不能很好适用于进行资讯推荐。
发明内容
为了解决上述技术问题,本发明的目的提供一种根据词汇关联性,且基于知识库的推荐方法、系统及装置。
本发明所采取的技术方案是:
一种基于知识库的推荐方法,包括以下步骤:
读取用户的资讯阅读记录;
根据资讯阅读记录,获取资讯阅读记录中资讯的标签,得到待分析标签;
根据待分析标签,分析生成推荐列表。
作为所述的一种基于知识库的推荐方法的进一步改进,所述的根据待分析标签,分析生成推荐列表,这一步骤具体包括:
根据待分析标签,得到对应的百科搜索关联词列表;
将各待分析标签的百科搜索关联词列表进行取交集处理,得到百科交集关联词;
读取百科交集关联词对应的百科搜索关联词列表,并判断待分析标签是否存在百科交集关联词对应的百科搜索关联词列表中,若是,则将该存在的待分析标签的词频与对应的百科交集关联词的词频进行叠加作为该百科交集关联词的词频;反之,则将该百科交集关联词对应的百科搜索关联词列表进行淘汰,其中,所述词频表示在百科搜索关联词列表中词频;
对资讯中的标签的词频叠加作为权值,并根据各资讯的权值由高到低进行排序,并将资讯加入到临时资讯关联池中,得到推荐列表。
作为所述的一种基于知识库的推荐方法的进一步改进,所述的根据待分析标签,分析生成推荐列表,这一步骤还包括:
若推荐列表中的资讯数量少于预设的资讯阈值,则获取待分析标签对应的关联词列表和关联组合列表;
根据待分析标签对应的关联词列表和关联组合列表,统计关联词出现比例和关联词组合出现比例;
根据预设的规则,将得到关联词出现比例和关联词组合比例作为对应资讯的权值,对资讯进行排序,并将资讯加入到临时资讯关联池中,得到推荐列表。
作为所述的一种基于知识库的推荐方法的进一步改进,所述的根据待分析标签,得到对应的百科搜索关联词列表,这一步骤具体包括:
根据待分析标签,在各百科平台搜索库中进行搜索,得到各百科平台的搜索结果;
对得到的各百科平台的搜索结果进行切词处理,得到搜索结果中的词汇,进而得到搜索结果中除去待分析标签以外的词汇作为搜索关联词;
对搜索关联词进行哈希值计算,并分别统计各百科平台的搜索关联词的词频;
将各百科平台的搜索关联词的种类进行交集处理,得到取交集后的搜索关联词;
根据取交集后的搜索关联词,对其词频进行平均数计算,进而建立得到对应的百科搜索关联词列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州艾媒数聚信息咨询股份有限公司,未经广州艾媒数聚信息咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710947514.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:一种定位的方法和装置