[发明专利]一种基于标签稀疏学习的Web服务发现方法有效

专利信息
申请号: 201510466572.3 申请日: 2015-07-31
公开(公告)号: CN105138594B 公开(公告)日: 2018-06-19
发明(设计)人: 尹建伟;罗威;邓水光;李莹;吴健;吴朝晖 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 胡红娟
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签 稀疏 文本信息 预测 服务描述文件 服务数据源 个性化服务 查询请求 关联标签 阶段混合 描述文件 模型工具 实时响应 提取服务 文本特征 优化服务 智能算法 多用户 有效地 再使用 挖掘 学习 优化 发现 研究
【说明书】:

发明公开了一种基于标签稀疏学习的Web服务发现方法,其目标系突破当前服务数据源使用单一的研究现状,充分使用文本信息优化服务发现的过程。该方法首先使用开源工具提取服务描述文件和关联标签的文本信息,再使用稀疏模型工具挖掘服务描述文件和标签之间的隐藏关系,最后通过优化学习实现了精确的标签预测功能。本发明充分挖掘WSDL文本特征以有效地提高标签预测的准确性;另外,本发明通过使用二阶段混合智能算法可实时响应多用户的个性化服务查询请求,产生的标签预测列表有助于提高Web服务发现的效能。

技术领域

本发明属于计算机服务技术领域,具体涉及一种基于标签稀疏学习的Web服务发现方法。

背景技术

随着Web 2.0时代科技革命的不断发展,互联网软件生产方法的主要形态、运行方式、生产方式和使用方式正发生着巨大的变化。基于Web服务动态聚合,自动组合和弹性伸缩的分布式服务发现成为了未来网络应用开发的重要趋势。这些Web服务技术应用都建立在服务搜索引擎发现和管理服务的基础上展开的。近年来,使用搜索引擎发现服务成为了工业界和学术界关注的重点。

目前关于Web服务主要是通过搜索引擎进行聚合和管理的。在实际操作中,用户提交搜索关键词,搜索引擎通过字符串匹配WSDL(网络服务描述语言)文件内容进行服务搜索和发现的。然而,这种方案的效率非常低下,原因如下:(1)当代企业组织的Web服务架构复杂,导致普通的WSDL包含非常多冗余的文本信息,直接进行字符串匹配造成资源浪费的问题。(2)当代互联网在蓬勃发展,Web服务呈指数型增长。匹配所有WSDL文件造成效率过低的问题。在真实情况下,工业界需要一种高效的服务索引策略,单纯使用WSDL的文本信息所造成的问题严重阻碍了服务计算领域发展。因此,新型的服务发现技术是Web服务研究的助推器。

现有技术中,学术界在探索使用标签进行服务索引并取得了长足的进步。然而,学术界普遍假设标记WSDL的服务标签是充足和准确的,这种前提在实际中存在几点不足:

1.事实上,标签是稀缺的。标签主要依赖于人工标记,和大数据服务增长相比,这样的标记显得过于低效,致使标签总是稀缺的。

2.由于标签是人工标记的,存在任意性和不规范化等缺点,单纯使用查询请求和标签进行匹配将直接降低服务发现效果。

发明内容

针对现有技术所存在的上述技术问题,本发明提出了一种基于标签稀疏学习的Web服务发现方法,能够有效地提高标签预测的准确性,进一步提高Web服务发现的效能。

一种基于标签稀疏学习的Web服务发现方法,包括如下步骤:

(1)收集服务集中各Web服务的WSDL文件以及人工标记的服务标签;

(2)对每个Web服务的WSDL文件和服务标签进行预处理;

(3)对于标签库中的任一标签,通过对以下目标函数L进行最小化求解,以求得该标签相对于服务集的权重向量w;

其中:vd为服务集中第d个Web服务WSDL文件的文本特征向量,D为服务集中所有Web服务的总个数;若该标签已被人工标记为第d个Web服务的服务标签,则yd=1,否则yd=0;α为预设的规则因子,T为向量转置;

(4)对于标签库中的任一标签,使该标签的权重向量w与服务集中每个Web服务WSDL文件的文本特征向量进行内积运算,对应得到该标签相对于每个Web服务的标记概率;

通过设定概率阈值,从服务集中提取出标记概率大于该概率阈值的Web服务,且使该标签作为这些Web服务的预测标签;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510466572.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top