[发明专利]一种基于多分类器融合模型的网络关系类型预测方法有效

专利信息
申请号: 201911414801.1 申请日: 2019-12-31
公开(公告)号: CN111160483B 公开(公告)日: 2023-03-17
发明(设计)人: 刘闯;于柿民;张子柯 申请(专利权)人: 杭州师范大学
主分类号: G06F18/214 分类号: G06F18/214;G06F18/24;G06N20/00;G06Q50/00
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杨舟涛
地址: 311121 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分类 融合 模型 网络 关系 类型 预测 方法
【权利要求书】:

1.一种基于多分类器融合模型的网络关系类型预测方法,其特征在于该方法具体是:

步骤(1).对网络数据进行预处理,具体是:

(1-1).网络数据结构化表示:网络数据存在结构化网络数据和半结构化网络数据,将半结构化网络数据转换成结构化网络数据{(vs1,ve1,flag1),(vs2,ve2,flag2),…,(vsi,vei,flagi),…,(vsn,ven,flagn)};其中,n表示网络边数量,vsi、vei分别表示始末节点,样本标签flagi等于1或-1,表示实际关系类型为友好或敌对,i=1,2,…,n;

(1-2).结构化网络数据标准化表示:结构化网络数据转换成边列表或邻接列表;

边列表:{(vs1,ve1),(vs2,ve2),…,(vsi,vei),…,(vsn,ven)},(vsi,vei)表示vsi、vei存在连边;

邻接列表:

{(vs1,vs1-e1,vs1-e2,…,vs1-ei,…,vs1-en),(vs2,vs2-e1,vs2-e2,…,vs2-ei,…,vs2-en),…,(vsk,vsk-e1,vsk-e2,…,vsk-ei,…,vsk-en)};k表示网络中每个节点的维数;

步骤(2).边列表或邻接列表利用Node2Vec网络嵌入方法进行节点表征,得到网络中每个节点的k维特征向量表示,具体是:

采用有偏的随机游走方法,通过参数p和q调控从一个节点向下一个节点的游走概率;给定节点v,随机游走选择下一个节点x的概率为:

其中,πvx为节点v和节点x之间的未归一化转移概率,Z是归一化常数;假设当前随机游走经过边(t,v)到达节点v,πvx=αpq(t,x)·wvx;αpq(t,x)表示节点x偏离节点t的概率,wvx是节点v和节点x之间的权重,节点t是随机游走序列中位于节点v的前一个节点;

dtx∈{0,1,2},表示节点t与节点x之间的最短距离;

用Node2Vec学习采样的顶点序列,得到节点的网络表征向量集:{(fv1-1,fv1-2,…,fv1-k),(fv2-1,fv2-2,…,fv2-k),…,(fvi-1,fvi-2,…,fvi-k),…,(fvn-1,vvn-2,…,fvn-k)};(fvi-1,fvi-2,…,fvi-k)表示网络中节点i对应的k维特征向量的表示;

步骤(3).对网络表征向量集进行网络特征工程处理,并划分训练集和测试集,具体是:

(3-1).网络特征工程:拼接相邻两个节点特征向量和两个节点特征向量的差向量得到3×k维的样本特征向量,即结构化网络数据转换GraphData={simple1,…,simplei,…simplen},其中样本simplei=([fsi-1,fsi-2,…,fsi-k],[fei-1,fei-2,…,fei-k],[fsi-1-fei-1,fsi-2-fei-2,…,fsi-k-fei-k],flagi)映射步骤(1-1)中结构化网络数据中的(vsi,vei,flagi);

(3-2).数据集划分:对GraphData进行随机抽取,70~80%数据作为训练集,20~30%数据作为测试集;

步骤(4).用GridCV调参方法分别对ExtraTrees、GradienBoosting、LightGBM、XGBboost基学习器在训练集上进行超参的调优:通过GridCV计算分别得到ExtraTrees、GradienBoosting、LightGBM和XGBboost的超参组合,用超参组合初始化各个基学习器,得到调优模型BaseModel1、BaseModel2、BaseModel3、BaseModel4

步骤(5).用得到的调优模型作为基学习器,采用K折交叉验证方法对训练集预测,融合基学习器预测结果作为元学习器RandomForest的输入数据,并输出最终网络关系类型预测的结果,具体是:

(5-1).K折交叉验证基学习器:在训练集上分别对BaseModel1、BaseModel2、BaseModel3、BaseModel4进行K折交叉验证,即将训练集分成K份,生成训练子集,四个基学习器分别得到训练子集的预测集R1、R2、R3、R4

(5-2).元学习器训练:将预测集R1、R2、R3、R4拼接得到新的训练集,用RandomForest作为元学习器进行训练,结合训练好的基学习器和元学习器得到最终的融合模型StackingModel;

(5-3).预测结果并评估:通过StackingModel对测试集进行预测,采用入Roc_auc、Binary_F1、Macro_F1、Micro_F1作为模型性能评价指标,评估预测结果的效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911414801.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top