[发明专利]基于公共文化知识图谱平台的综合推荐系统在审
申请号: | 201710163892.0 | 申请日: | 2017-03-16 |
公开(公告)号: | CN107122399A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 王健;张桂刚;杨颐;黄卫星 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 郭文浩,吴晓芬 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 公共 文化 知识 图谱 平台 综合 推荐 系统 | ||
技术领域
本发明属于文化大数据推荐系统领域和知识检索领域,具体涉及一种基于公共文化知识图谱平台的综合推荐系统。
背景技术
推荐系统根据用户浏览网页时的点击行为以及对网上资源的兴趣特点,向用户推荐其感兴趣的相关信息。推荐系统是个复杂的系统工程,依赖用户数据、架构、算法、人机交互等环节的有机结合,需要统计学技术、数据挖掘技术、信息检索技术等学科的统一结合。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和混合推荐。
随着互联网规模的不断扩大,文化领域资源的种类和数量也不断快速增长,用户有时需要花费大量的时间才能找到自己感兴趣的文化资源。这种浏览大量无关的信息和过程,无疑会使淹没在信息过载问题中的用户们不断流失。为了解决这些问题,基于公共数字文化的个性化推荐系统应运而生。
公共数字化文化综合个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,以帮助用户的阅读浏览提供个性化的决策支持和信息服务。通过对文化资源,如视频,和用户兴趣特点的分析,推荐系统根据用户的个人兴趣和行为模型,设计出一个混合的个性化推荐系统。它包含了基于物品的协同过滤机制,基于内容的推荐,从用户行为中提炼出来的兴趣主题模型,以及根据用户反馈信息对推荐系统的优化等等。
问题:当前大多数推荐系统,如基于内容的推荐、协同过滤、混合推荐等方法,聚焦在单一领域和单一类型的资源推荐上。推荐结果新颖性和多样化上有所不足,特别是当用户行为数据过少的时候,会出现冷启动和数据稀疏性问题,严重影响了推荐质量。新型的文化资源共享模式决定了文化信息的推荐技术具有以下需求,如图4所示:
跨领域:在不同领域的文化资源或信息之间进行推荐,例如,用户浏览文学信息的时候,为他推荐相关的音乐和美术作品;
跨类别:在不同类别的信息和资源之间进行推荐,比如小说“三国演义”跟诗词“临江仙·滚滚长江东逝水”属于不同的类别的文化信息,但是针对同一个主题;
跨结构:面向文化的推荐技术需要在异构数据之间进行推荐,例如,用户浏览图片的时候推荐文本和视频;
跨数据源:推荐来自不同的文化资源数据源和信息,例如,用户在浏览国博收藏品的时候,向他推荐上海博物馆的相关收藏品。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种基于公共文化知识图谱平台的综合推荐系统,以实现跨领域、跨类别、跨结构、跨数据源的公共文化知识推荐。
该系统包括:
标注单元,用于对提取到的资源分配资源标签,以及对提取到的用户数据分配用户兴趣标签;
标签库,用于存储所述资源标签和用户兴趣标签;
标签挖掘单元,用于对所述标签库中的标签进行挖掘分析;
推荐单元,用于根据所述标签挖掘单元的挖掘分析结果做公共文化信息的综合推荐;
可视化单元,用于对所述推荐单元的综合推荐结果进行可视化展示。
优选地,所述标注单元包括:
资源标注模块,用于在公共文化资源库中提取元数据,利用资源标签提取方法和标签补全方法对所述元数据进行资源标注,分配资源标签;
用户兴趣标注模块,用于在用户画像数据库中提取用户数据,利用基于知识挖掘的方法和基于机器学习的方法对所述用户数据进行标注,分配用户兴趣标签。
优选地,所述标签库中维护有标签列表,所述标签列表为对所述标签库中所存储的资源标签和用户兴趣标签进行消重后得到的标签列表。
优选地,所述推荐单元包括单项推荐模块和综合推荐模块,所述单项推荐模块具体包括资源推荐子模块、知识推荐子模块、标签推荐子模块和用户兴趣推荐子模块。
优选地,所述资源推荐子模块,用于基于内容推荐方式和协同过滤方式,将公共文化资源库中所包含的公共文化资源进行推荐;
所述知识推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做背景知识推荐;
所述标签推荐子模块,用于根据所述挖掘分析结果中所选择的资源标签做相关资源标签推荐;
所述用户兴趣推荐子模块,用于根据所述挖掘分析结果中用户的兴趣标签做对应的标签推荐。
优选地,所述标签推荐子模块中的资源标签推荐为根据各资源标签的重要性为用户推荐资源标签,各资源标签的权重计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710163892.0/2.html,转载请声明来源钻瓜专利网。