[发明专利]一种基于标签稀疏学习的Web服务发现方法有效
| 申请号: | 201510466572.3 | 申请日: | 2015-07-31 |
| 公开(公告)号: | CN105138594B | 公开(公告)日: | 2018-06-19 |
| 发明(设计)人: | 尹建伟;罗威;邓水光;李莹;吴健;吴朝晖 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
| 地址: | 310027 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 稀疏 文本信息 预测 服务描述文件 服务数据源 个性化服务 查询请求 关联标签 阶段混合 描述文件 模型工具 实时响应 提取服务 文本特征 优化服务 智能算法 多用户 有效地 再使用 挖掘 学习 优化 发现 研究 | ||
1.一种基于标签稀疏学习的Web服务发现方法,包括如下步骤:
(1)收集服务集中各Web服务的WSDL文件以及人工标记的服务标签;
(2)对每个Web服务的WSDL文件和服务标签进行预处理,其中对于WSDL文件,则利用XML工具提取WSDL文件的特征信息并建立对应的文本特征向量;对于服务标签,则利用自然语言处理中常用的开源文本规整化工具对服务标签进行规整化处理;
(3)对于标签库中的任一标签,通过对以下目标函数L进行最小化求解,以求得该标签相对于服务集的权重向量w;
其中:vd为服务集中第d个Web服务WSDL文件的文本特征向量,D为服务集中所有Web服务的总个数;若该标签已被人工标记为第d个Web服务的服务标签,则yd=1,否则yd=0;α为预设的规则因子,T为向量转置;具体采用以下迭代方程对目标函数L进行最小化求解:
其中:wt和wt+1分别为第t次迭代和第t+1次迭代标签相对于服务集的权重向量,为wt经梯度下降后的权重向量,wt+1(i)为权重向量wt+1中的第i个元素值,为权重向量中的第i个元素值,t为迭代次数,i为自然数且1≤i≤N,N为权重向量w的维度,θ为预设的迭代因子;
(4)对于标签库中的任一标签,使该标签的权重向量w与服务集中每个Web服务WSDL文件的文本特征向量进行内积运算,对应得到该标签相对于每个Web服务的标记概率;
通过设定概率阈值,从服务集中提取出标记概率大于该概率阈值的Web服务,且使该标签作为这些Web服务的预测标签;
(5)由服务搜索引擎接受用户的目标查询请求,若服务集小于一定数量规模,则服务搜索引擎直接将目标查询请求与服务集中每个Web服务的WSDL文件信息进行字符串匹配;若服务集大于一定数量规模,则服务搜索引擎直接将目标查询请求与服务集中每个Web服务的预测标签进行字符串匹配;最后将匹配上的Web服务展现给用户。
2.根据权利要求1所述的Web服务发现方法,其特征在于:所述的步骤(5)中最后将匹配上的Web服务包装成html页面格式,进而通过服务搜索引擎展现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510466572.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:易清理的阀座加工夹持机构
- 下一篇:轮辐打标识倒角机





