[发明专利]一种基于标签稀疏学习的Web服务发现方法有效

专利信息
申请号: 201510466572.3 申请日: 2015-07-31
公开(公告)号: CN105138594B 公开(公告)日: 2018-06-19
发明(设计)人: 尹建伟;罗威;邓水光;李莹;吴健;吴朝晖 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 胡红娟
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于标签稀疏学习的Web服务发现方法,其目标系突破当前服务数据源使用单一的研究现状,充分使用文本信息优化服务发现的过程。该方法首先使用开源工具提取服务描述文件和关联标签的文本信息,再使用稀疏模型工具挖掘服务描述文件和标签之间的隐藏关系,最后通过优化学习实现了精确的标签预测功能。本发明充分挖掘WSDL文本特征以有效地提高标签预测的准确性;另外,本发明通过使用二阶段混合智能算法可实时响应多用户的个性化服务查询请求,产生的标签预测列表有助于提高Web服务发现的效能。 1
搜索关键词: 标签 稀疏 文本信息 预测 服务描述文件 服务数据源 个性化服务 查询请求 关联标签 阶段混合 描述文件 模型工具 实时响应 提取服务 文本特征 优化服务 智能算法 多用户 有效地 再使用 挖掘 学习 优化 发现 研究
【主权项】:
1.一种基于标签稀疏学习的Web服务发现方法,包括如下步骤:(1)收集服务集中各Web服务的WSDL文件以及人工标记的服务标签;(2)对每个Web服务的WSDL文件和服务标签进行预处理,其中对于WSDL文件,则利用XML工具提取WSDL文件的特征信息并建立对应的文本特征向量;对于服务标签,则利用自然语言处理中常用的开源文本规整化工具对服务标签进行规整化处理;(3)对于标签库中的任一标签,通过对以下目标函数L进行最小化求解,以求得该标签相对于服务集的权重向量w;其中:vd为服务集中第d个Web服务WSDL文件的文本特征向量,D为服务集中所有Web服务的总个数;若该标签已被人工标记为第d个Web服务的服务标签,则yd=1,否则yd=0;α为预设的规则因子,T为向量转置;具体采用以下迭代方程对目标函数L进行最小化求解:其中:wt和wt+1分别为第t次迭代和第t+1次迭代标签相对于服务集的权重向量,为wt经梯度下降后的权重向量,wt+1(i)为权重向量wt+1中的第i个元素值,为权重向量中的第i个元素值,t为迭代次数,i为自然数且1≤i≤N,N为权重向量w的维度,θ为预设的迭代因子;(4)对于标签库中的任一标签,使该标签的权重向量w与服务集中每个Web服务WSDL文件的文本特征向量进行内积运算,对应得到该标签相对于每个Web服务的标记概率;通过设定概率阈值,从服务集中提取出标记概率大于该概率阈值的Web服务,且使该标签作为这些Web服务的预测标签;(5)由服务搜索引擎接受用户的目标查询请求,若服务集小于一定数量规模,则服务搜索引擎直接将目标查询请求与服务集中每个Web服务的WSDL文件信息进行字符串匹配;若服务集大于一定数量规模,则服务搜索引擎直接将目标查询请求与服务集中每个Web服务的预测标签进行字符串匹配;最后将匹配上的Web服务展现给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510466572.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top