[发明专利]一种领域百科图谱的构建方法及系统在审
申请号: | 202111254354.5 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113987204A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 宋伟;王鹏飞;刘圣;郑刘梦;焦亚鑫;赵化育 | 申请(专利权)人: | 北京迈迪培尔信息技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/284 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 梁晨 |
地址: | 100000 北京市门头沟*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 领域 百科 图谱 构建 方法 系统 | ||
本申请公开了一种领域百科图谱的构建方法及系统,该方法包括以下步骤:从多个开放百科数据源中采集领域相关词条,得到领域词条集;对所述领域词条集中的词条分别进行引用标注和标签标注,形成不同词条间的引用关系网络和分类树;基于所述引用关系网和所述分类树,构建领域百科图谱。本申请通过构建的开放百科数据采集模型,采集开放百科中的领域相关词条,对采集的词条集进行引用标注和标签标注,并依据标注的信息,按照领域百科关系模型构建领域百科图谱,能够以开放百科为素材实现快速、低人工参与地构建领域百科,并实现了相关词条之间的推荐能力。
技术领域
本申请属于计算机技术领域,具体涉及一种领域百科图谱的构建方法及系统。
背景技术
百科是一种价值密度较高的知识资源,相比于资讯信息,百科词条能够更加全面和完整的描述概念信息。当前,以维基百科、百度百科、互动百科、搜搜百科等为代表的开放百科已经成为互联网上最有价值的知识资源之一,几乎各行各业的名词概念都可以在这些开放百科中找到相关的词条,在一定程度上为用户获取数据知识提供了便利。
领域百科是只包含一个或若干个存在一定内在联系的学科(门类)知识的百科词条集合。相比于通用百科,领域百科具有知识聚焦和体系完备的特点,能够方便特定领域的用户快速定位和全面了解领域内知识。领域百科主要服务于特定领域的用户,相比于维基百科、百度百科、互动百科、搜搜百科等通用百科多采用的众包建设模式,领域百科的建设往往需要领域内的机构和人员组织开展,多以人工建设为主,费时费力,且难以适应数据爆炸式增长的时代特点。
因此,领域百科的建设应该解决以下几个问题:一是百科词条能够及时更新,二是通过对词条有效拓展支撑用户对相关概念的全面了解。一个良好的领域百科构建方法一般应具备以下三个特征:一是信息聚焦,领域百科的词条范围要尽量服务于领域需要,尽量少地提供领域无关词条,以提升数据价值密度,降低无关数据的干扰;二是构建迅速,领域百科的构建过程除必要的专家知识确认过程,应尽量提供自动化能力,以实现词条的快速扩充和完善;三是推荐有效,为提高用户的知识获取效率,构建的领域百科应具备词条的推荐能力,根据领域用户的使用习惯,词条的推荐应该围绕引用推荐和分类主题推荐展开。
以维基百科、百度百科、互动百科、搜搜百科等为代表的开放百科具有海量的百科词条,几乎涵盖了各行各业的名词概念。但是,对于特定领域的用户而言,使用开放百科获取数据知识仍然存在一些不足。一方面,海量的信息资源伴随着知识的不聚焦,无形中增加了特定领域用户获取数据知识的成本;另一方面,各个开放百科在特定领域的知识积累存在互补性,依靠单一的百科信源并不能很好的解决特定领域百科知识的获取需求。而采用人工从头构建领域百科的方式存在建设代价过高,不能快速大量构建的缺点。
本申请实施例的目的是提供一种领域百科图谱的构建方法及系统,以解决现有技术中的开放百科数据零散不聚焦,人工构建成本高的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,提供了一种领域百科图谱的构建方法,包括以下步骤:
从多个开放百科数据源中采集领域相关词条,得到领域词条集;
对所述领域词条集中的词条分别进行引用标注和标签标注,形成不同词条间的引用关系网络和分类树;
基于所述引用关系网和所述分类树,构建领域百科图谱。
第二方面,提供了一种领域百科图谱的构建系统,包括:
采集模块,用于从多个开放百科数据源中采集领域相关词条,得到领域词条集;
标注模块,用于对所述领域词条集中的词条分别进行引用标注和标签标注,形成不同词条间的引用关系网络和分类树;
构建模块,用于基于所述引用关系网和所述分类树,构建领域百科图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈迪培尔信息技术有限公司,未经北京迈迪培尔信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254354.5/2.html,转载请声明来源钻瓜专利网。