[发明专利]面向自然语言处理的语义Web服务智能代理有效

申请号：	201010109653.5	申请日：	2010-02-12
公开（公告）号：	CN101833561A	公开（公告）日：	2010-09-15
发明（设计）人：	刘志境;朱旭东;姚勇;王静;杨伟	申请（专利权）人：	西安电子科技大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/28
代理公司：	陕西电子工业专利中心 61205	代理人：	程晓霞
地址：	710032***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向自然语言处理语义 web 服务智能代理
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向自然语言处理的语义Web服务搜索方法，其特征在于，包括如下步骤：

A、将Web服务采集子系统采集的所有服务描述文件汇集为服务描述文集C；

B、采用信息抽取算法，处理服务描述文集C，获取描述服务语义的关键词；

C、从服务描述文集C抽取的所有关键词汇集为服务原始词汇集T；

D、采用词聚类算法，处理服务原始词汇集T，构造服务词汇表D；

E、基于服务词汇表D，采用概率隐含语义索引算法，处理服务描述文集C，自动构建服务描述文集C的语义索引；

F、基于服务描述文集C的语义索引，采用服务搜索算法，处理用户服务请求，从而实现服务搜索。

2.根据权利要求1所述的面向自然语言处理的语义Web服务搜索方法，其特征在于，所述信息抽取算法包括如下步骤：

B1、基于WSDL文件的文档对象模型，抽取下列标签的name属性：definitions、message、part、portType、operation、input、output、service、port；抽取targetNamespace标签的uri属性捕捉服务提供者信息；抽取part标签的element属性值捕捉服务发送和接收的数据结构；

B2、依据WSDL文件，采用复写、排序和添加三个操作以保存抽取属性在文件中的结构信息；

B3、采用基于最大匹配算法分割抽取，抽取属性为词组。

3.根据权利要求1所述面向自然语言处理的语义Web服务搜索方法，其特征在于，所述基于词汇相似度的词聚类算法包括如下步骤：

D1、定义词汇相似度Sim(t1,t2)=α×(l1+l2)(Dis(t1,t2)+α)×max(|l1-l2|,1),]]>其中l₁，l₂是t₁，