[发明专利]一种基于多源数据特征融合的web服务分类方法在审
申请号: | 202111591199.6 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114358155A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张晶;雷昌然 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F17/16 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 特征 融合 web 服务 分类 方法 | ||
本发明公开了一种基于多源数据特征融合的web服务分类方法,包括:S1:获取web服务的N个源数据,其中N不小于2;S2:对所述源数据分别进行预处理;S3:将预处理后的所述源数据进行特征提取,得到N个相应的输出特征矩阵;S4:将每个所述输出特征矩阵均输入N个多模态注意力模型和特征融合模型进行特征融合,得到分类特征向量;S5:将所述分类特征向量输入全连接层,输出分类结果。本发明提供的一种基于多源数据特征融合的web服务分类方法,与现有技术相比较,可以同时利用多种web服务的数据,对多种不同来源的web服务数据特征进行充分挖掘和融合,有效提高了web服务分类的准确率。
技术领域
本发明属于web服务自动分类技术领域,涉及一种基于多源数据特征融合的web服务分类方法。
背景技术
软件复用作为一种降低软件开发成本的重要方法,一直是软件工程领域研究的重要课题。web服务是一个平台独立的、低耦合的、自包含的、基于可编程的web的应用程序,大大简化了异构组件的复用难度。近年来,随着云计算技术的发展,越来越多高质量的web服务被发布在公共服务平台,供全世界的开发者调用,这是软件复用的重要资源。web服务公共存储库为服务发布者制定了服务发布规范,包括服务描述、服务名称、URL和搜索关键字(标签或标记)。
软件开发中复用web服务的关键是服务分类,即为海量的公共服务定义类别,以满足二次开发服务检索的需求。服务检索有两种常用的方法。第一种是基于关键词的方法,即服务调用者根据一个或者多个关键字检索选服务。第二种是基于语义web服务(如WDSL-S、OWL-S、WSMO等)的语义搜索。基于语义搜索的服务发现方法准确性更高,但这种方法高度依赖公共服务库中所有服务的语义信息和服务查询中的语义信息。因此,在实际使用过程中,这种方法存在很大的局限性。此外,基于语义搜索的服务发现方法效率远远低于基于关键字的方法。因此,在实践中,基于关键词的服务发现方法应用更为广泛。
基于关键词的服务发现方法的效果很大程度上取决于服务关键词的质量。以往服务关键词往往是由服务发布者人工选择的。然而,服务发布人员手工选择的服务关键词往往是不充分、不准确的。这主要是因为服务开发人员很难从海量的候选关键词中选择出对于当前服务最合适的关键词,而且开发人员也很难了解所有的候选关键词。
由于人工分配关键词的局限性大大限制了服务发现的效果,开始出现了通过机器学习方法自动进行关键词预测和标签推荐的工作。机器学习的服务关键词分配方法首先提取和服务有关的特征信息,然后采用合适的机器学习算法对特征进行分类,从而在候选库中选择对应的关键词。
目前现有的服务分类方法主要有基于传统方法和基于深度学习方法两类。
在传统方法中,分类和聚类是两种主流的服务类别分组方法。服务聚类是将具有相同特征的web服务汇聚到同一个分组中,使得同一类群服务之间的相似性较大,而不同类群的服务之间差异较大。聚类本身属于无监督学习,因此采用聚类方法时,这些web服务数据是不需要指定标签的。服务聚类经常会用于服务发现中,通过功能描述预先对web服务进行聚类,在请求者搜索服务时可以集中在相似的组内进行查找,剔除了无关服务对服务发现的干扰,从而提高服务发现的效率。分类是根据已知标签的数据集的训练结果对未知标签的文档指定类标号。服务分类同样可以改进web服务发现与组合的性能,而且由于分类是有监督学习,分类结果会有明确的类别标签,因而不需要人工的参与。
传统方法都取得了一定的成果,但传统机器学习算法的效果不可避免受到特征工程质量的影响,随着深度学习的发展,越来越多的服务分类研究转向了深度学习。随着深度学习算法的快速发展,近年来机器学习领域取得了重大进展。深度学习方法取得优异的成绩主要得益于深度学习模型强大的特征提取和表示能力,近年来,深度学习模型也被广泛应用于服务分类任务中,但是多数方法太过简单,没有充分利用多源数据信息,准确率低。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于多源数据特征融合的web服务分类方法,至少部分解决上述技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111591199.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置