[发明专利]一种基于图向量的专家组合推荐方法有效
| 申请号: | 201910293927.1 | 申请日: | 2019-04-12 |
| 公开(公告)号: | CN110162638B | 公开(公告)日: | 2023-06-20 |
| 发明(设计)人: | 朱全银;季睿;倪金霆;朱亚飞;万瑾;孙强;陈凌云;陈晓艺 | 申请(专利权)人: | 淮阴工学院 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
| 地址: | 223005 江苏省淮安市洪泽区东七街三号高*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 向量 专家 组合 推荐 方法 | ||
1.一种基于图向量的专家组合推荐方法,其特征在于,具体步骤如下:
(1)从专家审查数据中抽取实体VecID和关系ReID,构建领域知识图谱G,包括:
(1.1)抽取专家和项目的编号ID={id1,id2,…,ide,…,idA}及领域标签Label={label1,label2,…,labele,…,labelA},得到7维领域标签数据集G1,G1=G1∪{ID,Label};其中,变量e∈[1,A];
(1.2)抽取实体关系的编号,得到ReID={reid1,reid2,…,reide,…,reidA},得到实体集VecID=VecID∪ID和关系集ReID;其中,变量e∈[1,A];
(1.3)定义循环变量i1来遍历VecID、ReID,G为领域知识图谱;i1赋初值1,G赋初值为空;
(1.4)通过实体间关系搭建领域知识图谱G=(VecID,ReID);
(1.5)得到专家审查项目领域知识图谱G;
(2)运用deepwalk算法将知识图谱投射到64维空间,得到实体向量集V1;运用独热码将领域标签转换成7维标签向量;构建神经网络进行多标签分类,包括:
(2.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;
(2.2)定义循环变量i2来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};运用独热码将领域标签转换成7维标签向量l1,L1=L1∪{l1};
(2.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];
(2.4)得到Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}},ide为实体集中第e个编号,rese为标签集中第e个实体的标签向量,其中,变量e∈[1,A];
(2.5)构建以binary_crossentropy为损失函数的神经网络,在训练过程中不断降低交叉嫡,使标签1的节点输出靠近1,标签0的节点输出靠近0;
(2.6)得到Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}},ide为实体集中第e个编号,pree为标签集中第e个实体的标签向量,其中,变量e∈[1,A];
(2.7)在真实标签集Res={{id1,res1},{id2,res2},...,{ide,rese},...,{idA,resA}}和预测标签集Pre={{id1,pre1},{id2,pre2},...,{ide,pree},...,{idA,preA}}中对标签值进行排序,截取前N个标签进行准确度度量;
(3)分别运用node2vec算法deepwalk算法将知识图谱投射到128维空间和64维空间;再分别运用皮尔逊相关度算法和曼哈顿距离度量公式计算得到TopN个最相关实体集合U,包括:
(3.1)取知识图谱G=(VecID,ReID),VecID为实体编号,ReID为关系编号;
(3.2)定义循环变量i3用来遍历G;运用deepwalk将G投射到64维空间,得到实体向量v1,V1=V1∪{v1};
(3.3)得到V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;L1={l1,l2,…,lc,…,lA},lc为实体向量集中第c个实体向量,其中,变量c∈[1,A];
(3.4)对于实体向量集中第c个实体向量vc,运用皮尔逊相关度算法计算得到topN个最相关实体集合U1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};
(3.5)定义专家组合推荐列表U=u1∩u2,实现专家组合推荐;
(3.6)定义循环变量i4用来遍历G;运用node2vec将G投射到128维空间,得到实体向量v2,V2=V2∪{v2};
(3.7)运用皮尔逊相关度算法计算得到topN个最相关实体集合W1={u11,u12,…,u1A},运用曼哈顿距离计算得到topN个最相关实体集合U2={u21,u22,…,u2A};
(3.8)得到以皮尔逊相关度算法为度量方式的推荐集合W和以曼哈顿距离为度量方式的推荐集合U;
(4)取实体向量集V1,利用PCA分别降维到2维和7维空间;得到2维向量数据集R和7维向量数据集Q;运用余弦相似度算法计算得到TopN个最相关实体U1,U2;定义得到的推荐列表为Recommend=U1∩U2,包括:
(4.1)取实体向量集V1={v1,v2,…,vc,…,vA},vc为实体向量集中第c个实体向量;vc的维度是64维;
(4.2)利用PCA降维后得到实体的2维向量集,R={r1,r2,…,rc,…,rA},rc为实体向量集R中第c个实体向量;
(4.3)对于实体向量集中第c个实体向量rc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U1={u1top1,u1top2,…,u1topx,…,u1topA};u1topx为U1中的第x个数据项,x∈[1,A];
(4.4)利用PCA降维后得到实体的7维向量集,Q={q1,q2,…,qc,…,qA},qc为实体向量集Q中第c个实体向量;
(4.5)对于实体向量集中第c个实体向量qc=vc,运用余弦相似度算法计算得到topN个最相关实体集合U2={u2top1,u2top2,…,u2topx,…,u2topA};u2topx为U2中的第x个数据项,u2topx∈U2,x∈[1,A];
(5)取实体向量集V1,基于知识图谱中实体间关系,搭建CNN,RESNET模型对实体间关系进行学习,使得模型能够拟合知识库中的实体关系数据;基于此模型,对输入的实体向量挖掘知识库中的隐藏关系;得到推荐列表U3;
(6)用未通过降维处理的数据所形成的推荐列表U和降维后运用不同算法得到的推荐列表Recommend以及通过模型预测的推荐列表U3得到最终的推荐列表Result=U∪Recommend∪U3;定义Set={set1,set2,…,setA},计算组合推荐的准确率previous=(set∩Result)/Result;得到最终推荐结果和推荐准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910293927.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息图谱构建方法、装置及设备
- 下一篇:识图知意的方法、装置、设备及存储介质





