[发明专利]一种基于图向量的专家组合推荐方法有效

专利信息
申请号: 201910293927.1 申请日: 2019-04-12
公开(公告)号: CN110162638B 公开(公告)日: 2023-06-20
发明(设计)人: 朱全银;季睿;倪金霆;朱亚飞;万瑾;孙强;陈凌云;陈晓艺 申请(专利权)人: 淮阴工学院
主分类号: G06F16/36 分类号: G06F16/36;G06F16/28
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 梁耀文
地址: 223005 江苏省淮安市洪泽区东七街三号高*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 向量 专家 组合 推荐 方法
【权利要求书】:

1.一种基于图向量的专家组合推荐方法,其特征在于,具体步骤如下:

(1)从专家审查数据中抽取实体VecID和关系ReID,构建领域知识图谱G,包括:

(1.1)抽取专家和项目的编号ID={id1,id2,…,ide,…,idA}及领域标签Label={label1,label2,…,labele,…,labelA},得到7维领域标签数据集G1,G1=G1∪{ID,Label};其中,变量e∈[1,A];

(1.2)抽取实体关系的编号,得到ReID={reid1,reid2,…,reide,…,reidA},得到实体集VecID=VecID∪ID和关系集ReID;其中,变量e∈[1,A];

(1.3)定义循环变量i1来遍历VecID、ReID,G为领域知识图谱;i1赋初值1,G赋初值为空;

(1.4)通过实体间关系搭建领域知识图谱G=(VecID,ReID);

(1.5)得到专家审查项目领域知识图谱G;

(2)运用deepwalk算法将知识图谱投射到64维空间,得到实体向量集V1;运用独热码将领域标签转换成7维标签向量;构建神经网络进行多标签分类,包括:

(2.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;

(2.2)定义循环变量i2来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};运用独热码将领域标签转换成7维标签向量l1,L1=L1∪{l1};

(2.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];

(2.4)得到Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}},ide为实体集中第e个编号,rese为标签集中第e个实体的标签向量,其中,变量e∈[1,A];

(2.5)构建以binary_crossentropy为损失函数的神经网络,在训练过程中不断降低交叉嫡,使标签1的节点输出靠近1,标签0的节点输出靠近0;

(2.6)得到Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}},ide为实体集中第e个编号,pree为标签集中第e个实体的标签向量,其中,变量e∈[1,A];

(2.7)在真实标签集Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}}和预测标签集Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}}中对标签值进行排序,截取前N个标签进行准确度度量;

(3)分别运用node2vec算法deepwalk算法将知识图谱投射到128维空间和64维空间;再分别运用皮尔逊相关度算法和曼哈顿距离度量公式计算得到TopN个最相关实体集合U,包括:

(3.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;

(3.2)定义循环变量i3用来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};

(3.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];

(3.4)对于实体向量集中第c个实体向量vc,运用皮尔逊相关度算法计算得到topN个最相关实体集合U1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};

(3.5)定义专家组合推荐列表U=u1∩u2,实现专家组合推荐;

(3.6)定义循环变量i4用来遍历G;运用node2vec将G投射到128维空间,得到实体向量v2,V2=V2∪{v2};

(3.7)运用皮尔逊相关度算法计算得到topN个最相关实体集合W1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};

(3.8)得到以皮尔逊相关度算法为度量方式的推荐集合W和以曼哈顿距离为度量方式的推荐集合U;

(4)取实体向量集V1,利用PCA分别降维到2维和7维空间;得到2维向量数据集R和7维向量数据集Q;运用余弦相似度算法计算得到TopN个最相关实体U1,U2;定义得到的推荐列表为Recommend=U1∩U2,包括:

(4.1)取实体向量集V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;vc的维度是64维;

(4.2)利用PCA降维后得到实体的2维向量集,R={r1,r2,…,rc,…,rA},rc为实体向量集R中第c个实体向量;

(4.3)对于实体向量集中第c个实体向量rc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U1={u1top1,u1top2,…,u1topx,…,u1topA};u1topx为U1中的第x个数据项,x∈[1,A];

(4.4)利用PCA降维后得到实体的7维向量集,Q={q1,q2,…,qc,…,qA},qc为实体向量集Q中第c个实体向量;

(4.5)对于实体向量集中第c个实体向量qc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U2={u2top1,u2top2,…,u2topx,…,u2topA};u2topx为U2中的第x个数据项,u2topx∈U2,x∈[1,A];

(5)取实体向量集V1,基于知识图谱中实体间关系,搭建CNN,RESNET模型对实体间关系进行学习,使得模型能够拟合知识库中的实体关系数据;基于此模型,对输入的实体向量挖掘知识库中的隐藏关系;得到推荐列表U3;

(6)用未通过降维处理的数据所形成的推荐列表U和降维后运用不同算法得到的推荐列表Recommend以及通过模型预测的推荐列表U3得到最终的推荐列表Result=U∪Recommend∪U3;定义Set={set1,set2,…,setA},计算组合推荐的准确率previous=(set∩Result)/Result;得到最终推荐结果和推荐准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910293927.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top