[发明专利]一种基于图向量的专家组合推荐方法有效

申请号：	201910293927.1	申请日：	2019-04-12
公开（公告）号：	CN110162638B	公开（公告）日：	2023-06-20
发明（设计）人：	朱全银;季睿;倪金霆;朱亚飞;万瑾;孙强;陈凌云;陈晓艺	申请（专利权）人：	淮阴工学院
主分类号：	G06F16/36	分类号：	G06F16/36;G06F16/28
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	梁耀文
地址：	223005 江苏省淮安市洪泽区东七街三号高***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于向量专家组合推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图向量的专家组合推荐方法，其特征在于，具体步骤如下：

(1)从专家审查数据中抽取实体VecID和关系ReID，构建领域知识图谱G，包括：

(1.1)抽取专家和项目的编号ID＝{id₁,id₂,…,id_e,…,id_A}及领域标签Label＝{label₁,label₂,…,label_e,…,label_A}，得到7维领域标签数据集G1，G1＝G1∪{ID,Label}；其中，变量e∈[1,A]；

(1.2)抽取实体关系的编号，得到ReID＝{reid₁,reid₂,…,reid_e,…,reid_A}，得到实体集VecID＝VecID∪ID和关系集ReID；其中，变量e∈[1,A]；

(1.3)定义循环变量i1来遍历VecID、ReID，G为领域知识图谱；i1赋初值1，G赋初值为空；

(1.4)通过实体间关系搭建领域知识图谱G＝(VecID,ReID)；

(1.5)得到专家审查项目领域知识图谱G；

(2)运用deepwalk算法将知识图谱投射到64维空间，得到实体向量集V1；运用独热码将领域标签转换成7维标签向量；构建神经网络进行多标签分类，包括：

(2.1)取知识图谱G＝(VecID,ReID)，VecID为实体编号，ReID为关系编号；

(2.2)定义循环变量i2来遍历G；运用deepwalk将G投射到64维空间，得到实体向量v1，V1＝V1∪{v1}；运用独热码将领域标签转换成7维标签向量l1，L1＝L1∪{l1}；

(2.3)得到V1＝{v₁,v₂,…,v_c,…,v_A}，v_c为实体向量集中第c个实体向量；L1＝{l₁,l₂,…,l_c,…,l_A}，l_c为实体向量集中第c个实体向量，其中，变量c∈[1,A]；

(2.4)得到Res＝{{id₁,res₁},{id₂,res₂},...,{id_e,res_e},...,{id_A,res_A}}，id_e为实体集中第e个编号，res_e为标签集中第e个实体的标签向量，其中，变量e∈[1,A]；

(2.5)构建以binary_crossentropy为损失函数的神经网络，在训练过程中不断降低交叉嫡，使标签1的节点输出靠近1，标签0的节点输出靠近0；

(2.6)得到Pre＝{{id₁,pre₁},{id₂,pre₂},...,{id_e,pre_e},...,{id_A,pre_A}}，id_e为实体集中第e个编号，pre_e为标签集中第e个实体的标签向量，其中，变量e∈[1,A]；

(2.7)在真实标签集Res＝{{id₁,res₁},{id₂,res₂},...,{id_e,res_e},...,{id_A,res_A}}和预测标签集Pre＝{{id₁,pre₁},{id₂,pre₂},...,{id_e,pre_e},...,{id_A,pre_A}}中对标签值进行排序，截取前N个标签进行准确度度量；

(3)分别运用node2vec算法deepwalk算法将知识图谱投射到128维空间和64维空间；再分别运用皮尔逊相关度算法和曼哈顿距离度量公式计算得到TopN个最相关实体集合U，包括：

(3.1)取知识图谱G＝(VecID,ReID)，VecID为实体编号，ReID为关系编号；

(3.2)定义循环变量i3用来遍历G；运用deepwalk将G投射到64维空间，得到实体向量v1，V1＝V1∪{v1}；

(3.3)得到V1＝{v₁,v₂,…,v_c,…,v_A}，v_c为实体向量集中第c个实体向量；L1＝{l₁,l₂,…,l_c,…,l_A}，l_c为实体向量集中第c个实体向量，其中，变量c∈[1,A]；

(3.4)对于实体向量集中第c个实体向量v_c，运用皮尔逊相关度算法计算得到topN个最相关实体集合U1＝{u1₁,u1₂,…,u1_A}，运用曼哈顿距离计算得到topN个最相关实体集合U2＝{u2₁,u2₂,…,u2_A}；

(3.5)定义专家组合推荐列表U＝u1∩u2，实现专家组合推荐；

(3.6)定义循环变量i4用来遍历G；运用node2vec将G投射到128维空间，得到实体向量v2，V2＝V2∪{v2}；

(3.7)运用皮尔逊相关度算法计算得到topN个最相关实体集合W1＝{u1₁,u1₂,…,u1_A}，运用曼哈顿距离计算得到topN个最相关实体集合U2＝{u2₁,u2₂,…,u2_A}；

(3.8)得到以皮尔逊相关度算法为度量方式的推荐集合W和以曼哈顿距离为度量方式的推荐集合U；

(4)取实体向量集V1，利用PCA分别降维到2维和7维空间；得到2维向量数据集R和7维向量数据集Q；运用余弦相似度算法计算得到TopN个最相关实体U1，U2；定义得到的推荐列表为Recommend＝U1∩U2，包括：

(4.1)取实体向量集V1＝{v₁,v₂,…,v_c,…,v_A}，v_c为实体向量集中第c个实体向量；v_c的维度是64维；

(4.2)利用PCA降维后得到实体的2维向量集，R＝{r₁,r₂,…,r_c,…,r_A}，r_c为实体向量集R中第c个实体向量；

(4.3)对于实体向量集中第c个实体向量r_c＝v_c，运用余弦相似度算法计算得到topN个最相关实体集合U1＝{u1_top1,u1_top2,…,u1_topx,…,u1_topA}；u1_topx为U1中的第x个数据项，x∈[1,A]；

(4.4)利用PCA降维后得到实体的7维向量集，Q＝{q₁,q₂,…,q_c,…,q_A}，q_c为实体向量集Q中第c个实体向量；

(4.5)对于实体向量集中第c个实体向量q_c＝v_c，运用余弦相似度算法计算得到topN个最相关实体集合U2＝{u2_top1,u2_top2,…,u2_topx,…,u2_topA}；u2_topx为U2中的第x个数据项，u2_topx∈U2，x∈[1,A]；

(5)取实体向量集V1，基于知识图谱中实体间关系，搭建CNN,RESNET模型对实体间关系进行学习，使得模型能够拟合知识库中的实体关系数据；基于此模型，对输入的实体向量挖掘知识库中的隐藏关系；得到推荐列表U3；

(6)用未通过降维处理的数据所形成的推荐列表U和降维后运用不同算法得到的推荐列表Recommend以及通过模型预测的推荐列表U3得到最终的推荐列表Result＝U∪Recommend∪U3；定义Set＝{set1,set2,…,setA}，计算组合推荐的准确率previous＝(set∩Result)/Result；得到最终推荐结果和推荐准确率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于淮阴工学院，未经淮阴工学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910293927.1/1.html，转载请声明来源钻瓜专利网。

上一篇：信息图谱构建方法、装置及设备
下一篇：识图知意的方法、装置、设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图向量的专家组合推荐方法有效

专利文献下载