[发明专利]学术影响力的预测方法及装置在审
| 申请号: | 201711269496.2 | 申请日: | 2017-12-05 |
| 公开(公告)号: | CN109871974A | 公开(公告)日: | 2019-06-11 |
| 发明(设计)人: | 佟津乐;罗学文;谢海华;陈雪飞;黄肖俊;高良才;汤帜 | 申请(专利权)人: | 北大方正集团有限公司;北大方正信息产业集团有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62;G06Q50/20 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
| 地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络图 特征数据 预测 预测模型 引用 标识信息 获取目标 预测处理 统计 申请 | ||
1.一种学术影响力的预测方法,其特征在于,包括:
获取待预测的目标学者的学术数据;
根据所述目标学者的学术数据,获取所述目标学者的特征数据,所述特征数据包括所述目标学者标识信息、基于引用网络图的特征、基于合著网络图的特征、以及基于统计的特征;
根据所述特征数据,采用训练好的预测模型对所述目标学者的学术影响力进行预测处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征数据,采用训练好的预测模型对所述目标学者的学术影响力进行预测处理,包括:
根据所述特征数据,采用训练好的LightGBM(Light Gradient BoostingMachine,轻量级梯度提升机)预测模型对所述目标学者的学术影响力进行预测处理。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征数据,采用训练好的LightGBM预测模型对所述目标学者的学术影响力进行预测处理,包括:
分别采用第一分类器、第二分类器、第一回归器和第二回归器,对所述特征数据进行预测处理,获得对应的第一结果信息、第二结果信息、第三结果信息和第四结果信息;
分别对所述第三结果信息和所述第四结果信息进行log2(1+x)的反变换,获得对应的第五结果信息和第六结果信息;
根据所述第一结果信息、第二结果信息、第五结果信息和第六结果信息,确定所述目标学者的预测被引用结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一结果信息、第二结果信息、第五结果信息和第六结果信息,确定所述目标学者的预测被引用结果,包括:
若所述第一结果信息为0,则将0作为所述目标学者的预测被引用结果;
若所述第一结果信息为非0,且所述第二结果信息为小于第一预设阈值,则将所述第五结果信息作为所述目标学者的预测被引用结果;
若所述第一结果信息为非0,且所述第二结果信息为大于或等于所述第一预设阈值,则将所述第六结果信息作为所述目标学者的预测被引用结果。
5.根据权利要求1-4任一项所述的方法,其特征在于,在获取待预测的学术数据之前,所述方法还包括:
获取预设的用于训练的训练学术数据;
根据所述训练学术数据,获取训练学者的训练特征数据及对应的被引用结果,所述训练特征数据包括所述训练学者标识信息、基于引用网络图的特征、基于合著网络图的特征、以及基于统计的特征;
根据所述训练特征数据、所述被引用结果及预设规则,对所述训练特征数据进行分类处理,获得第一分类器、第二分类器、第一回归器和第二回归器对应的目标训练数据;
采用所述目标训练数据对所述第一分类器、第二分类器、第一回归器和第二回归器进行训练,获得所述训练好的预测模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述训练特征数据、所述被引用结果及预设规则,对所述训练特征数据进行分类处理,获得第一分类器、第二分类器、第一回归器和第二回归器对应的目标训练数据,包括:
将所述训练特征数据中所述被引用结果大于0的训练学者的被引用结果变换为1,将所述被引用结果等于0的训练学者的被引用结果保持不变,获得第一分类器的目标训练数据;
将所述训练特征数据中所述被引用结果大于或等于第一预设阈值的训练学者的被引用结果变换为1,将所述被引用结果小于第一预设阈值的训练学者的被引用结果变换为0,获得第二分类器的目标训练数据;
将所述训练特征数据中所述被引用结果大于或等于第一预设阈值的训练学者的训练特征数据及对应的被引用结果去除,并将剩余的训练学者的被引用结果进行log2(1+x)变换处理,获得第一回归器的目标训练数据;
将所述训练特征数据中所述被引用结果小于第一预设阈值的训练学者的训练特征数据及对应的被引用结果去除,并将剩余的训练学者的被引用结果进行log2(1+x)变换处理,获得第二回归器的目标训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北大方正信息产业集团有限公司,未经北大方正集团有限公司;北大方正信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711269496.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





