[发明专利]防止学者论文库过拆分的历史错误纠正方法和系统在审
申请号: | 202210199458.9 | 申请日: | 2022-03-02 |
公开(公告)号: | CN114707574A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 房小涵;李晓彦;宋健;赵祎;仇瑜;刘德兵;褚晓泉;李青 | 申请(专利权)人: | 北京智谱华章科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/295 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 杜月 |
地址: | 100084 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提出一种防止学者论文库过拆分的历史错误纠正方法与系统,该方法包括:对学者名称进行重新构建;根据能够唯一确定作者的信息对目标学者论文库和待分配的论文簇进行直接匹配;对于匹配未成功的论文簇,通过BERT‑Bi‑LSTM‑CRF模型识别论文的作者相关信息和摘要中的实体信息;分别计算待匹配的论文包括的作者所属机构信息和期刊信息的匹配度;分别计算每个候选对齐论文簇与目标学者论文库的相似性特征,判断每个候选对齐论文簇与目标学者论文库是否对齐;将集成学习模型判定为对齐的候选对齐论文簇进行合并,并对未对齐的论文簇进行人工标注。该方法可解决消歧过程产生的过拆分错误,提高了过拆分错误纠正的速度、精确度和召回率。 | ||
搜索关键词: | 防止 学者 论文库 拆分 历史 错误 纠正 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智谱华章科技有限公司,未经北京智谱华章科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210199458.9/,转载请声明来源钻瓜专利网。