[发明专利]一种基于多分类器融合模型的网络关系类型预测方法有效

申请号：	201911414801.1	申请日：	2019-12-31
公开（公告）号：	CN111160483B	公开（公告）日：	2023-03-17
发明（设计）人：	刘闯;于柿民;张子柯	申请（专利权）人：	杭州师范大学
主分类号：	G06F18/214	分类号：	G06F18/214;G06F18/24;G06N20/00;G06Q50/00
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	杨舟涛
地址：	311121 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于分类融合模型网络关系类型预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多分类器融合模型的网络关系类型预测方法，其特征在于该方法具体是：

步骤(1).对网络数据进行预处理，具体是：

(1-1).网络数据结构化表示：网络数据存在结构化网络数据和半结构化网络数据，将半结构化网络数据转换成结构化网络数据{(v_s1,v_e1,flag₁),(v_s2,v_e2,flag₂),…,(v_si,v_ei,flag_i),…,(v_sn,v_en,flag_n)}；其中，n表示网络边数量，v_si、v_ei分别表示始末节点，样本标签flag_i等于1或-1，表示实际关系类型为友好或敌对，i＝1,2,…,n；

(1-2).结构化网络数据标准化表示：结构化网络数据转换成边列表或邻接列表；

边列表：{(v_s1,v_e1),(v_s2,v_e2),…,(v_si,v_ei),…,(v_sn,v_en)}，(v_si,v_ei)表示v_si、v_ei存在连边；

邻接列表：

{(v_s1,v_s1-e1,v_s1-e2,…,v_s1-ei,…,v_s1-en),(v_s2,v_s2-e1,v_s2-e2,…,v_s2-ei,…,v_s2-en),…,(v_sk,v_sk-e1,v_sk-e2,…,v_sk-ei,…,v_sk-en)}；k表示网络中每个节点的维数；

步骤(2).边列表或邻接列表利用Node2Vec网络嵌入方法进行节点表征，得到网络中每个节点的k维特征向量表示，具体是：

采用有偏的随机游走方法，通过参数p和q调控从一个节点向下一个节点的游走概率；给定节点v，随机游走选择下一个节点x的概率为：

其中，π_vx为节点v和节点x之间的未归一化转移概率，Z是归一化常数；假设当前随机游走经过边(t,v)到达节点v，π_vx＝α_pq(t,x)·w_vx；α_pq(t,x)表示节点x偏离节点t的概率，w_vx是节点v和节点x之间的权重，节点t是随机游走序列中位于节点v的前一个节点；

d_tx∈{0,1,2}，表示节点t与节点x之间的最短距离；

用Node2Vec学习采样的顶点序列，得到节点的网络表征向量集：{(f_v1-1,f_v1-2,…,f_v1-k),(f_v2-1,f_v2-2,…,f_v2-k),…,(f_vi-1,f_vi-2,…,f_vi-k),…,(f_vn-1,v_vn-2,…,f_vn-k)}；(f_vi-1,f_vi-2,…,f_vi-k)表示网络中节点i对应的k维特征向量的表示；

步骤(3).对网络表征向量集进行网络特征工程处理，并划分训练集和测试集，具体是：

(3-1).网络特征工程：拼接相邻两个节点特征向量和两个节点特征向量的差向量得到3×k维的样本特征向量，即结构化网络数据转换GraphData＝{simple₁,…,simple_i,…simple_n}，其中样本simple_i＝([f_si-1,f_si-2,…,f_si-k],[f_ei-1,f_ei-2,…,f_ei-k],[f_si-1-f_ei-1,f_si-2-f_ei-2,…,f_si-k-f_ei-k],flag_i)映射步骤(1-1)中结构化网络数据中的(v_si,v_ei,flag_i)；

(3-2).数据集划分：对GraphData进行随机抽取，70～80％数据作为训练集，20～30％数据作为测试集；

步骤(4).用GridCV调参方法分别对ExtraTrees、GradienBoosting、LightGBM、XGBboost基学习器在训练集上进行超参的调优：通过GridCV计算分别得到ExtraTrees、GradienBoosting、LightGBM和XGBboost的超参组合，用超参组合初始化各个基学习器，得到调优模型BaseModel₁、BaseModel₂、BaseModel₃、BaseModel₄；

步骤(5).用得到的调优模型作为基学习器，采用K折交叉验证方法对训练集预测，融合基学习器预测结果作为元学习器RandomForest的输入数据，并输出最终网络关系类型预测的结果，具体是：

(5-1).K折交叉验证基学习器：在训练集上分别对BaseModel₁、BaseModel₂、BaseModel₃、BaseModel₄进行K折交叉验证，即将训练集分成K份，生成训练子集，四个基学习器分别得到训练子集的预测集R₁、R₂、R₃、R₄；

(5-2).元学习器训练：将预测集R₁、R₂、R₃、R₄拼接得到新的训练集，用RandomForest作为元学习器进行训练，结合训练好的基学习器和元学习器得到最终的融合模型StackingModel；

(5-3).预测结果并评估：通过StackingModel对测试集进行预测，采用入Roc_auc、Binary_F1、Macro_F1、Micro_F1作为模型性能评价指标，评估预测结果的效果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州师范大学，未经杭州师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911414801.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多分类器融合模型的网络关系类型预测方法有效

专利文献下载