[发明专利]基于主题模型聚类的Web API推荐方法有效
申请号: | 202110508530.7 | 申请日: | 2021-05-11 |
公开(公告)号: | CN113343078B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 陆佳炜;郑嘉弘;赵伟;马超治;徐俊;张元鸣;肖刚 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F40/216;G06F40/284;G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 模型 web api 推荐 方法 | ||
一种基于主题模型聚类的Web API推荐方法,根据上下文信息计算单词的语义权重信息从而得到文档‑单词语义权重信息矩阵D;统计单词共现信息,从而计算出SPPMI矩阵信息;基于得到Mashup服务文档单词的词频信息矩阵D,单词的上下文SPPMI矩阵M,通过分解M可以得到词嵌入信息矩阵,进一步将上述两种信息进行结合,计算服务的主题信息;将得到的Mashup服务主题特征,作为谱聚类的输入进行聚类,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,子图内的边权重和尽可能的高,达到聚类的目的;结合GBDT和FM方法对Web API服务进行预测推荐。本发明有效实现Web API推荐。
技术领域
本发明涉及到一种针对Mashup服务构建基于主题模型聚类的Web API服务推荐方法。
背景技术
随着互联网技术的不断成熟,服务互联网化成本不断降低,在服务计算“服务化”的思想驱动下,越来越多的公司将数据、资源或者相关业务发布到互联网上,以提高信息的利用率和自身竞争力。然而传统的服务大多数遵循简单对象访问协议,通常针对某一特定领域的业务需求,提供单一功能的服务,此外还存在技术体系复杂、扩展性差等问题,难以适应现实生活中复杂多变的应用场景。因此,对于Web服务提供商而言,如何能够根据现实用户以及自身业务需求的具体变动,快速地对已有的服务资源重新整合,成为一个亟待解决的问题。
为克服传统服务带来的问题,互联网逐渐出现一种以混搭技术为基础的Mashup服务,以缓解传统服务难以适应复杂多变应用环境的问题。Mashup服务能将单一功能的服务和多种数据资源进行整合混搭,构建出综合性的Web应用,从而满足用户多变的技术。Mashup服务开发十分便捷,软件开发人员只需从服务注册平台,直接选取出若干合适的服务或者数据源,并按照相应的指示流程,便可以着手具有相应混合功能的Mashup服务的开发。由于Mashup服务适用性强,灵活度高,而且相对易于开发,Mashup服务逐渐受到企业和开发者的青睐。
然而,随着互联网上Web API服务数量的不断增多,在Web API推荐中,推荐系统需要面对两个问题:一是Mashup服务描述文档通常比较简短、特征稀疏、信息量少,如何有效地根据简短的描述信息提取Mashup服务描述需求的潜在信息,二是Web API服务集合数量众多,大大地增加推荐系统搜索相关联API服务的工作量,如何快速的、有效地确定Web API服务候选集合。
发明内容
为了有效解决Web API推荐中的问题,本发明提出一种基于主题模型聚类的WebAPI推荐方法,该方法首先基于非负矩阵分解(Non-negative Matrix Factorization,NMF)方法提取Mashup服务需求,已有Mashup服务集以及Web API的主题特征,根据采用谱聚类算法对Mashup服务聚类后得到Mashup服务类簇后,将Mashup服务描述需求主题信息与类簇进行相似度计算,选择最相近的Mashup类簇,根据类簇中已有的Mashup服务调用关系,确定推荐Web API的候选集合,最后结合梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和因子分解机(Factorization Machine,FM)方法,对Web API推荐进行预测。
本发明所采用的技术方案是:
一种基于主题模型聚类的Web API推荐方法,所述方法包括如下步骤:
第一步:根据上下文信息计算单词的语义权重信息从而得到文档-单词语义权重信息矩阵D;
第二步:统计单词共现信息,从而计算出SPPMI矩阵信息;
第三步:基于第一步,第二步得到Mashup服务文档单词的词频信息矩阵D,单词的上下文SPPMI矩阵M,通过分解M可以得到词嵌入信息矩阵,进一步将上述两种信息进行结合,计算服务的主题信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110508530.7/2.html,转载请声明来源钻瓜专利网。