[发明专利]一种基于多分类器融合模型的网络关系类型预测方法有效
申请号: | 201911414801.1 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111160483B | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 刘闯;于柿民;张子柯 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N20/00;G06Q50/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 311121 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 融合 模型 网络 关系 类型 预测 方法 | ||
本发明公开了一种基于多分类器融合模型的网络关系类型预测方法。本发明方法包括:对网络数据进行预处理,包括对半结构化数据进行网络结构的提取,转换成边列表或邻接列表;对边列表或邻接列表利用Node2Vec网络嵌入方法进行节点表征,得到网络中每个节点的k维特征向量表示;通过拼接相邻两个节点特征向量和两个节点特征向量的差向量得到3×k维的样本特征向量,划分训练集和测试集;利用调参后的分类方法作为基学习器进行决策;融合基学习器分类结果作为元学习器的输入数据,并输出最终网络关系类型预测的结果。本发明方法适用于普遍的社交网络数据,提高了预测的准确度。
技术领域
本发明属于计算机技术领域,具体是复杂网络中的链路预测技术领域,涉及一种基于多分类器融合模型的网络关系类型预测方法。
背景技术
复杂关系的社会,生物分子结构都抽象成网络表示,而大多数真实网络数据存在缺失,例如,社会关系网络中人物关系存在抽样或隐藏的问题,微生物医学领域需要大量实验推断细胞或组织之间相互作用。在不同的领域根据研究的问题的不同,构建网络结构,分析挖掘网络结构中“可能存在的连接”或者“缺失的连接”,会给不同领域带来新的发现,推动相应的领域发展。
网络中链路预测的定义即为“通过网络结构网络属性等信息预测网络中尚未产生两个节点之间存在连接的可能性”。链路预测算法综合运用了相似性分析、网络动力学、贝叶斯模型、机器学习、模体分析和最大似然分析等多学科方法。
在社交网络领域,大多研究者除了挖掘网络中两个节点是否存在关系的可能性,也倾向于挖掘节点之间的连边关系,网络关系类型预测应用于推荐,广告和社区检测等场景,社交网络中的连边关系类型分为“+”和“-”,分别代表关系的好坏,地位或技能的高低等。已有相关研究者将平衡理论应用于网络关系类型预测,即“朋友的朋友是我的朋友,敌人的朋友是我的敌人,朋友的敌人是我的敌人,敌人的敌人是我的朋友”。平衡理论致力于探索三角形网络结构的特性,捕获三个用户之间的关系,预测正链和负链。然而现实中,往往存在大量的“桥”边,即两个相邻节点的之间连边,且这两个相邻节点没有任何公共邻居,而“三角形”边是由至少含有一个公共邻居的两个相邻节点构成。
尽管带关系的有向网络中的大多数边都可以包含在三角形中,但“桥”边也是全局存在的。根据平衡理论,将三角形中的节点相互连接,可以有效地对三角形中的边进行网络关系类型预测。“桥”边则缺少三角形信息,不能用平衡理论进行建模。因此,对“桥”边进行网络关系类型预测是一项具有挑战性的工作。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于多分类器融合模型的网络关系类型预测方法。
本发明方法利用带关系的社交网络公共数据Slashdot、Epinions和Wikirfa,采用网络嵌入方法中的Node2Vec方法和机器学习中融合模型的思想,设计了一套基于社交网络的关系类型预测方法,在含“桥”边的网络数据集上Roc_auc、Binary_F1、Macro_F1、Micro_F1均表现,本发明方法同样适用于普遍的社交网络数据,推动了相应的推荐,广告和社团发现等领域的发展。
本发明方法具体是:
步骤(1).对网络数据进行预处理,具体是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911414801.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:岩体结构探测及危石探测系统及方法
- 下一篇:一种基于深度信息的模具检验方法