[发明专利]一种基于多任务学习的云服务发现方法有效

申请号：	202110371604.7	申请日：	2021-04-07
公开（公告）号：	CN112966096B	公开（公告）日：	2022-05-24
发明（设计）人：	曾骏;于扬;姚娟;文俊浩	申请（专利权）人：	重庆大学
主分类号：	G06F16/335	分类号：	G06F16/335;G06F16/9535;G06F16/33;G06N3/04;G06N3/08
代理公司：	重庆晟轩知识产权代理事务所(普通合伙) 50238	代理人：	王海凤
地址：	400044 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于任务学习服务发现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多任务学习的云服务发现方法，其特征在于，包括如下步骤：

S100：将服务请求者查询活动定义为会话每一个会话S_m由服务请求者在一定时间内按顺序提交给搜索引擎的一系列查询Q_m＝{q_m，1，q_m，2，...，q_m，n}，每个查询q_m，i由对应的一组候选服务描述文档列表D＝{d_m，1，d_m，2，...，d_m，k}组成，服务请求者的当前会话S_M表示为服务请求者的短期查询历史以前的会话{S₁，S₂，...，S_M-1}表示服务请求者的长期查询历史

S200：构建PDAML模型，所述PDAML模型由ad-hoc模块和个性化模块构成；

S210：所述ad-hoc模块包括服务描述文档检索模块，所述服务描述文档检索模块包括六层：

第一层，字符嵌入层：字符嵌入层使用字符级卷积神经网络CNN将组成每个单词的所有字符映射到一个向量空间；

对于服务请求者的查询q和其候选服务描述文档d，假设分别由J和T个单词组成，表示为和组成每个单词的所有字符分别字符级卷积神经网络CNN转化为字符向量，再将嵌入的字符向量作为卷积神经网络1D卷积的输入，结果经过最大池化max-pooling处理后为每个单词获得固定大小的向量表示其中d_c是卷积核的数量；

第二层，词嵌入层：使用预训练的单词向量GloVe将每个单词映射成固定大小的向量；

查询的单词向量和服务描述文档的单词向量分别表示为其中d_w表示单词嵌入维度；

字符嵌入和词嵌入完成后，将它们的连接送入一个两层的高速公路网络分别得到表示查询的查询矩阵和表示服务描述文档的矩阵其中，d_g是高速公路网络的输出维度大小；

第三层，上下文嵌入层：采用一个双向的循环神经网络Bi-RNN对所述查询矩阵Q和服务描述文档矩阵D进行上下文编码；

将高速公路网络的输出查询矩阵Q和服务描述文档矩阵D作为Bi-RNN的输入，参见公式(2)，它将感知上下文信息，得到查询的上下文向量和服务描述文档的上下文向量

h_t＝f(x_t，h_t-1) (2)

其中，x_t为f(·)的输入(Q_j或者D_t)，h₀被初始化为零向量，在我们的模型中，f(·)选择为LSTM；

第四层，双向注意力层：计算查询和服务描述文档的相似度矩阵S∈R^T×J，参见公式(3)：

其中，Q_1，j表示Q₁的第j列向量，D_1，t表示D₁的第t列向量，这表明第j个查询中的单词和第t个服务描述文档中的单词之间的相似性，是可学习的参数，⊙运算符表示元素点乘，[；]运算符表示向量连接操作；

计算候选服务描述文档对查询方向的注意力，a_t∈R^J表示候选服务描述文档中的第t个单词对查询中的单词的注意力权重，根据注意权重为查询生成服务描述文档对查询方向的注意向量具体地：

a_t＝softmax(S_t：)∈R^J (4)

表示候选服务描述文档对查询方向的注意向量