[发明专利]基于主题模型聚类的Web API推荐方法有效

专利信息
申请号: 202110508530.7 申请日: 2021-05-11
公开(公告)号: CN113343078B 公开(公告)日: 2022-07-15
发明(设计)人: 陆佳炜;郑嘉弘;赵伟;马超治;徐俊;张元鸣;肖刚 申请(专利权)人: 浙江工业大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/35;G06F40/216;G06F40/284;G06K9/62
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 主题 模型 web api 推荐 方法
【说明书】:

一种基于主题模型聚类的Web API推荐方法,根据上下文信息计算单词的语义权重信息从而得到文档‑单词语义权重信息矩阵D;统计单词共现信息,从而计算出SPPMI矩阵信息;基于得到Mashup服务文档单词的词频信息矩阵D,单词的上下文SPPMI矩阵M,通过分解M可以得到词嵌入信息矩阵,进一步将上述两种信息进行结合,计算服务的主题信息;将得到的Mashup服务主题特征,作为谱聚类的输入进行聚类,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,子图内的边权重和尽可能的高,达到聚类的目的;结合GBDT和FM方法对Web API服务进行预测推荐。本发明有效实现Web API推荐。

技术领域

本发明涉及到一种针对Mashup服务构建基于主题模型聚类的Web API服务推荐方法。

背景技术

随着互联网技术的不断成熟,服务互联网化成本不断降低,在服务计算“服务化”的思想驱动下,越来越多的公司将数据、资源或者相关业务发布到互联网上,以提高信息的利用率和自身竞争力。然而传统的服务大多数遵循简单对象访问协议,通常针对某一特定领域的业务需求,提供单一功能的服务,此外还存在技术体系复杂、扩展性差等问题,难以适应现实生活中复杂多变的应用场景。因此,对于Web服务提供商而言,如何能够根据现实用户以及自身业务需求的具体变动,快速地对已有的服务资源重新整合,成为一个亟待解决的问题。

为克服传统服务带来的问题,互联网逐渐出现一种以混搭技术为基础的Mashup服务,以缓解传统服务难以适应复杂多变应用环境的问题。Mashup服务能将单一功能的服务和多种数据资源进行整合混搭,构建出综合性的Web应用,从而满足用户多变的技术。Mashup服务开发十分便捷,软件开发人员只需从服务注册平台,直接选取出若干合适的服务或者数据源,并按照相应的指示流程,便可以着手具有相应混合功能的Mashup服务的开发。由于Mashup服务适用性强,灵活度高,而且相对易于开发,Mashup服务逐渐受到企业和开发者的青睐。

然而,随着互联网上Web API服务数量的不断增多,在Web API推荐中,推荐系统需要面对两个问题:一是Mashup服务描述文档通常比较简短、特征稀疏、信息量少,如何有效地根据简短的描述信息提取Mashup服务描述需求的潜在信息,二是Web API服务集合数量众多,大大地增加推荐系统搜索相关联API服务的工作量,如何快速的、有效地确定Web API服务候选集合。

发明内容

为了有效解决Web API推荐中的问题,本发明提出一种基于主题模型聚类的WebAPI推荐方法,该方法首先基于非负矩阵分解(Non-negative Matrix Factorization,NMF)方法提取Mashup服务需求,已有Mashup服务集以及Web API的主题特征,根据采用谱聚类算法对Mashup服务聚类后得到Mashup服务类簇后,将Mashup服务描述需求主题信息与类簇进行相似度计算,选择最相近的Mashup类簇,根据类簇中已有的Mashup服务调用关系,确定推荐Web API的候选集合,最后结合梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和因子分解机(Factorization Machine,FM)方法,对Web API推荐进行预测。

本发明所采用的技术方案是:

一种基于主题模型聚类的Web API推荐方法,所述方法包括如下步骤:

第一步:根据上下文信息计算单词的语义权重信息从而得到文档-单词语义权重信息矩阵D;

第二步:统计单词共现信息,从而计算出SPPMI矩阵信息;

第三步:基于第一步,第二步得到Mashup服务文档单词的词频信息矩阵D,单词的上下文SPPMI矩阵M,通过分解M可以得到词嵌入信息矩阵,进一步将上述两种信息进行结合,计算服务的主题信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110508530.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top