[发明专利]一种用于mashup应用推荐的协同过滤方法在审
申请号: | 201310414793.7 | 申请日: | 2013-09-12 |
公开(公告)号: | CN103473128A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 窦万春;胡蓉 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F9/46 | 分类号: | G06F9/46 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 mashup 应用 推荐 协同 过滤 方法 | ||
技术领域
本发明涉及计算机软件技术领域,特别是一种用于mashup应用的推荐的协同过滤方法。
背景技术
自20世纪80年代开始,全球产业结构呈现出“工业型经济”向“服务型经济”转型的总趋势。根据世界银行的统计,现代服务业的总产出占世界总产出的60%以上,而发达国家则超过70%。现代服务业的竞争正成为世界经济发展的焦点。服务计算提供灵活的计算架构支持现代服务业,逐渐成为极富前途的研究领域。
随着服务计算和Web2.0技术的发展,一种新型的网络应用mashup应用在因特网上逐渐兴起。互联网实验室的《2006-2007互联网前沿发展大趋势》中指出:“Mashup应用将成为未来内容创新性组合的全新方式。而Mashup应用程序就是使用这种模式搭建而成的全新的创新服务,使用到外部的多个数据源的内容和服务,把松散的资源、要素、服务和功能集成在网络环境中,并且新的服务的价值大于所使用服务组合的简单叠加,它带给用户集成体验;分散在各地的页面被以一种新奇的重用模式合并、表达出来。Mashup应用体现了面向服务的框架(Service Oriented Architecture,SOA)的理念,是一种基于网络的、可复用的、轻量级的内容集成。近年来,mashup应用已经成为web应用领域的热门词汇,许多公司和机构提供了多种多样的mashup应用解决方案或将已有的整合方案重新标记为mashup应用工具。目前,已推出的mashup应用开发工具主要有Yahoo!Pipes、Microsoft’s PopFly、Google Mashup Editor、IBM Damia以及Mash Maker等。这些工具使得用户更加容易、方便地糅合web应用,加速了mashup应用的开发进程,导致mashup应用的数目日益增加。来自programmableweb网站的数据显示,截至2013年9月5日,全球在该网站上注册的API数目达到9902个,基于API开发的mashup应用达到7172个。典型的mashup应用包括地图mashup应用,图片和视频mashup应用,搜索和购物mashup应用等。这些mashup应用及其生成的数据具有数据量大、处理速度快、数据类型多等大数据特征。为了从大数据中发现知识并加以利用,指导人们的决策,必须对这些数据进行深入的分析,而不是仅仅生成简单的报表。
面对大量类似功能的mashup应用,大部分用户缺乏足够的经验或能力选择合适的mashup应用,因此,为用户推荐适合个性需求的mashup应用,成为当前急需解决的问题。推荐系统是解决信息过载问题的有效手段之一,而协同过滤是推荐系统中最常用的方法。协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。然而,随着mashup应用及其产生的数据量越来越大,mashup应用的协同过滤技术面临诸多挑战:(1)mashup应用数量巨大,但推荐系统需极可能快地作出响应;(2)尽管mashup应用增长迅速,但表达用户对mashup应用的兴趣的信息非常稀疏,使得用户或mashup应用之间相似度的计算可能不准确;(3)mashup应用的种类越来越多,从用户对各种其他类别中的mashup应用的评价推测其对于给定mashup应用的评价很可能并不准确;(4)新的用户和新的mashup应用不断加入推荐系统,推荐算法应该快速、准确地更新。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术中响应时间长,推荐质量不高的缺陷,提供一种用于mashup应用推荐的协同过滤方法。
为了解决上述技术问题,本发明公开了一种用于mashup应用推荐的协同过滤方法,包括以下步骤:
步骤1,计算mashup应用之间的内容相似度:提取所有mashup应用的应用程序接口(Application Programming Interface,API)和标签信息,基于杰卡德相似系数(Jaccard Similarity Coefficient,JSC),得到任意两个mashup应用之间的API相似度和标签相似度,加权合成mashup应用之间的内容相似度;
步骤2,传递内容相似度:建立一个无向加权图,图中一个结点对应一个mashup应用并以相应的mashup应用为标记,若两个mashup应用之间内容相似度不为0,则在以这两个mashup应用为标记的结点之间加上一条边,而这两个mashup应用之间的内容相似度则作为边的权值,然后根据相似度传递规则匹配情况,计算两个不直接相连但有路径相通的mashup应用之间被传递的内容相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310414793.7/2.html,转载请声明来源钻瓜专利网。