[发明专利]基于可靠信息库的学术成果机构命名排歧方法及装置在审
申请号: | 201911017874.7 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110990524A | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 唐杰;邵洲;袁莎;刘德兵 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王艳斌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于可靠信息库的学术成果机构命名排歧方法及装置,其中,该方法包括:从学术成果文本中提取机构相关信息,并获取机构字符串;按照特殊字符对机构字符串进行分割,并对分割后的字符串部分实体命名识别,将属于实体命名的存入疑似机构队列;对疑似机构队列进行地理位置信息映射,得到机构地理位置信息;根据可靠机构数据集进行多类名称相似度计算,得到疑似机构实体序列和对应的最高相似名称相似度值;对疑似机构实体序列进行地址抽取及地理位置信息映射,并通过与机构地理位置信息上的距离和最高相似名称相似度值的最终相似度值筛选出最佳结果。该方法能够简单快速准确地实现学术成果中机构的命名排歧,并实现机构名称的标准化。 | ||
搜索关键词: | 基于 可靠 信息库 学术 成果 机构 命名 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911017874.7/,转载请声明来源钻瓜专利网。