[发明专利]一种文献参数匹配方法、系统及服务装置有效
申请号: | 201910785927.3 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110704644B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 耿树文;王茜;黄鹏;胡寅骏;孙虎 | 申请(专利权)人: | 上海科技发展有限公司 |
主分类号: | G06F16/38 | 分类号: | G06F16/38;G06F16/383 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 王华英 |
地址: | 200052 上海市徐汇区淮海中路1634*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文献 参数 匹配 方法 系统 服务 装置 | ||
1.一种文献参数匹配方法,其特征在于,包括:
获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者姓名与所述第二文献的待匹配作者姓名相同;其中,第一参数集包括所述第一文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息和若干文献基金;所述第二参数集包括所述第二文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息和若干文献基金;
基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集,包括:选取所述第一参数集中的全部参数作为第一初始检索条件进行文献检索,并记录检索结果;逐步减少所述第一参数集中的参数个数,以此作为第一新检索条件进行文献检索,并分别记录检索结果;汇总所有的检索结果作为所述第一关联检索文献集;其中,所述第一新检索条件中,包括第一文献的待匹配作者姓名,期刊中图分类号,以及第一文献的刊物名称、待匹配作者单位、若干共同作者信息和若干文献基金所构成群组中的至少一个;
基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集,包括:选取所述第二参数集中的全部参数作为第二初始检索条件进行文献检索,并记录检索结果;逐步减少所述第二参数集中的参数个数,并以此作为第二新检索条件进行文献检索,并分别记录检索结果;汇总所有的检索结果作为所述第二关联检索文献集,其中,所述第二新检索条件中,至少包括第二文献的待匹配作者姓名,期刊中图分类号,以及第二文献的刊物名称、待匹配作者单位、若干共同作者信息和若干文献基金所构成群组中的至少一个;
对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集;
根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者;
所述对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集的步骤包括:
将所述第一关联检索文献集中的任意一篇文献分别与所述第二关联检索文献集的每一篇文献进行关联比较参数的匹配,以获取信息重合度数据子集,其中,所述信息重合度数据子集中的每个数据为所述第一关联检索文献集中的一篇文献的关联比较参数与所述第二关联检索文献集的每一篇文献的关联比较参数的相同参数的个数;
遍历所述第一关联检索文献集中的所有文献,以获取所述信息重合度数据集;
所述根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者的步骤包括:
获取所述信息重合度数据集中所有数据中的最大值,作为重合度最大值;
选取所述第一文献的关联比较参数集的参数个数与所述第二文献的关联比较参数集的参数个数之间的最小值,作为参数最小值;
根据所述重合度最大值与所述参数最小值之间的比值判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者;
其中,所述关联比较参数包括对应文献的刊物名称、发表日期、待匹配作者单位、若干共同作者信息或若干文献基金。
2.根据权利要求1所述的文献参数匹配方法,其特征在于,所述第一文献的期刊中图分类号和所述第二文献的期刊中图分类号相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海科技发展有限公司,未经上海科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785927.3/1.html,转载请声明来源钻瓜专利网。