[发明专利]面向自然语言处理的语义Web服务智能代理有效

专利信息
申请号: 201010109653.5 申请日: 2010-02-12
公开(公告)号: CN101833561A 公开(公告)日: 2010-09-15
发明(设计)人: 刘志境;朱旭东;姚勇;王静;杨伟 申请(专利权)人: 西安电子科技大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/28
代理公司: 陕西电子工业专利中心 61205 代理人: 程晓霞
地址: 710032*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 自然语言 处理 语义 web 服务 智能 代理
【权利要求书】:

1.一种面向自然语言处理的语义Web服务搜索方法,其特征在于,包括如下步骤:

A、将Web服务采集子系统采集的所有服务描述文件汇集为服务描述文集C;

B、采用信息抽取算法,处理服务描述文集C,获取描述服务语义的关键词;

C、从服务描述文集C抽取的所有关键词汇集为服务原始词汇集T;

D、采用词聚类算法,处理服务原始词汇集T,构造服务词汇表D;

E、基于服务词汇表D,采用概率隐含语义索引算法,处理服务描述文集C,自动构建服务描述文集C的语义索引;

F、基于服务描述文集C的语义索引,采用服务搜索算法,处理用户服务请求,从而实现服务搜索。

2.根据权利要求1所述的面向自然语言处理的语义Web服务搜索方法,其特征在于,所述信息抽取算法包括如下步骤:

B1、基于WSDL文件的文档对象模型,抽取下列标签的name属性:definitions、message、part、portType、operation、input、output、service、port;抽取targetNamespace标签的uri属性捕捉服务提供者信息;抽取part标签的element属性值捕捉服务发送和接收的数据结构;

B2、依据WSDL文件,采用复写、排序和添加三个操作以保存抽取属性在文件中的结构信息;

B3、采用基于最大匹配算法分割抽取,抽取属性为词组。

3.根据权利要求1所述面向自然语言处理的语义Web服务搜索方法,其特征在于,所述基于词汇相似度的词聚类算法包括如下步骤:

D1、定义词汇相似度Sim(t1,t2)=α×(l1+l2)(Dis(t1,t2)+α)×max(|l1-l2|,1),]]>其中l1,l2是t1

t2分别所处的层次,α>0是可调参数;

D2、初始化聚类集合为空;

D3、从服务原始词汇集T中读入一个新词;

D4、以这个词构造一个新的类;

D5、若已到服务原始词汇集T末尾,则结束,否则利用D1步骤中定义的词汇相似度,计算所读入新词与每个已有类间的距离,并选择最小的距离;

D6、若最小距离超过给定的阈值,则转步骤D3;

D7、否则将该词并入具有最小距离的类中并更新该类的各分类属性值的统计频度及数值属性的质心,转步骤D3;

D8、以所获得类的中心词为词汇,汇集构造服务词汇表D。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010109653.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top