[发明专利]一种WEB服务发现方法及其装置无效
申请号: | 201210149014.0 | 申请日: | 2012-05-14 |
公开(公告)号: | CN103425646A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 黄华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 郝新慧;张浴月 |
地址: | 开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 web 服务 发现 方法 及其 装置 | ||
技术领域
本申请涉及互联网技术,尤其涉及一种WEB服务发现方法及其装置。
背景技术
WEB服务(WEB Service)是一种面向服务的架构的技术,通过标准的WEB协议提供服务,目的是保证不同平台的应用服务可以互操作。从表面上看,WEB service就是一个应用程序,它向外界暴露出一个能够通过WEB进行调用的应用程序接口(API),该API通过网络执行客户所提交服务的请求。如图1所示,WEB服务提供者采用WSDL(WEB service div language)语言对其所提供的WEB服务进行服务描述,并将该WEB服务发布到UDDI(Universal Description Discovery and Integration)注册中心,然后服务请求者通过UDDI(Universal Description Discovery and Integration)注册中心发现该服务,并通常基于SOAP协议进行通信。
UDDI注册中心是用来发布和搜索WEB服务,通过它服务请求者可找到目标WEB服务。举例而言,航空行业发布了一个用于航班比率检测和预订的WEB服务,航空公司就可以把它们的服务注册到一个UDDI中心的目录中。然后旅行社就能够搜索这个UDDI目录以发现航空公司预订服务。当此预订服务被发现之后,旅行社可通过SOAP协议与此服务进行通信,从而可以直接使用一套定义良好的预订功能。
由于现有的WEB服务发现基于UDDI注册中心,从而所有的客户端都依赖一个UDDI注册中心,在性能上存在一定的瓶颈,而某些大的UDDI注册中心早在几年之前就宣布永久关闭,这更大制约了WEB服务发现的发展。
并且,随着WEB服务技术的不断发展,网络上部署的WEB服务越来越多,现有的基于UDDI的WEB服务发现依赖用户向其注册库中添加WEB服务注册信息,而很多用户因为各方面原因没有向其中注册WEB服务,这样的WEB服务在基于UDDI方式下是不能成为WEB服务发现目标的;有的WEB服务可能已经下线,但是UDDI中依然保留其信息,这样可能会导致无效的WEB服务被发现。
不仅如此,上述UDDI注册中心是基于关键字的匹配方式进行WEB服务发现,匹配的结果会比较粗糙,同义、近意、或者语义相似度比较高的WEB服务都不能被发现。
发明内容
为了解决上述问题,本申请提供一种WEB服务发现方法,能够高精确、范围广地搜索到WEB服务。
因此,本申请所提供的WEB服务发现方法,包括:接受用户的WEB服务发现请求;基于一WSDL索引通过搜索引擎对所述用户的请求进行查询,将查询获得的WEB服务列表返回给所述用户,所述WSDL索引是基于互联网上的WEB服务而被建立的;
其中,通过下述步骤建立所述WSDL索引:S1,从互联网上抓取WEB页面;S2,从所述抓取的WEB页面中解析出其包含的WSDL文档的链接URL,并以此链接URL取得相应的WSDL文档;S3,从解析出的WSDL文档中抽取与WEB服务相关的信息;S4,将所抽取出的WEB服务相关信息建立WSDL索引。
根据本申请的一个实施例,在所述步骤S2中,对所抓取到WEB页面之中的每个链接作遍历测试,如果其为有效链接,则以该链接作为WSDL文档的链接URL,并对该链接对应的WSDL页面内容进行解析处理,建立该链接的WSDL文档,如果该链接是无效链接,忽略该链接,继续处理下一个链接。
根据本申请的一个实施例,在所述步骤S3中,所述与WEB服务有关的信息包括WEB服务的服务名、服务描述、操作名、操作描述以及操作的输入输出参数。
根据本申请的一个实施例,在所述步骤S4中,以WEB服务中的每个操作作为一个文档,分别将服务名、服务描述、操作名、操作描述、输入类型、输出类型、WSDL链接URL作为七个域建立WSDL索引。
根据本申请的一个实施例,在所述步骤S4的建立WSDL索引过程中,对所述与WEB服务有关的信息内容使用了切词处理,具体包括下述步骤:S31:判断所述与WEB服务有关的信息是否为有效字符串,是则进行步骤S32,否则退出该切词处理算法不进行切词处理;S32:根据WEB服务的命名规范,建立一正则表达式,利用该正则表达式对所述有效字符串进行第一次切词处理,建立切词表;S33:根据单词之间的拼写规范,依次对所述切词表中的每个字符串进行二次切词处理,将所切出的单词加入到切词集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210149014.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于位置服务的场馆信息搜索方法和装置
- 下一篇:一种多媒体问答系统及方法