[发明专利]一种本体构建方法、装置、电子设备及存储介质在审
申请号: | 201910360257.0 | 申请日: | 2019-04-30 |
公开(公告)号: | CN111858948A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 展丽霞;姜伟浩;浦世亮;闫春 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06F40/284 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;马敬 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 本体 构建 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种本体构建方法、装置、电子设备及存储介质,其特征在于,该方法包括:获取用于构建本体的目标数据;对目标数据中的结构化数据进行实例化处理,得到结构化数据中包括的各个第一对象;以及,对目标数据中的非结构化数据进行实例化处理,得到非结构化数据中包括的各个第二对象;从本体模板库中确定与各个第一对象均匹配的目标本体模板;利用第二对象的类型,对目标本体模板中的对象字段进行补充;将各个第一对象和各个第二对象映射到补充后的目标本体模板,得到目标数据对应的本体。通过本发明实施例提供的技术方案,可以提高目标数据对应的本体的数据完善度。
技术领域
本发明涉及计算机技术领域,特别是涉及一种本体构建方法、装置、电子设备及存储介质。
背景技术
本体是对真实世界中的实体、实体涉及的事件信息、实体之间的关系以及事件信息之间的关系的描述,用户可以在本体中对被本体描述的实体进行查询。例如,本体描述的实体为人,用户可以在该本体中查询人涉及的事件信息。
相关技术中,利用数据构建本体的过程为:获得待构建本体的目标数据,对目标数据中的结构化数据进行实例化处理,得到结构化数据包括的对象;从本体模板库中选取与所得到的对象匹配的本体模板,并将数据映射到该本体模板,得到目标数据对应的本体。其中,对象可以为:实体、实体涉及的事件信息、实体之间的关系及事件信息之间的关系等,本体模板中包括多个对象字段,所谓的映射即为将每一对象作为相匹配对象字段的字段内容。
但是,相关技术中,在构建本体时,用于构建本体的本体模板即为依赖数据中的结构化数据来选取本体模板,这样,对于包含结构化数据和非结构化数据的目标数据而言,所构建的本体中仅仅包括结构化数据,导致所构建的本体的数据完善度不高。
发明内容
本发明实施例的目的在于提供一种本体构建方法、装置、电子设备及存储介质,以提高所构建的本体的数据完善度。具体技术方案如下:
第一方面,本发明实施例提供了一种本体构建方法,所述方法包括:
获取用于构建本体的目标数据;
对所述目标数据中的结构化数据进行实例化处理,得到所述结构化数据中包括的各个第一对象;以及,对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的各个第二对象;
从本体模板库中确定与所述各个第一对象均匹配的目标本体模板;
利用所述第二对象的类型,对所述目标本体模板中的对象字段进行补充;
将所述各个第一对象和各个第二对象映射到补充后的目标本体模板,得到所述目标数据对应的本体。
可选的,所述利用所述第二对象的类型,对所述目标本体模板中的对象字段进行补充的步骤,包括:
判断各个第二对象的类型是否存在于目标本体模板的对象字段中;
针对每个第二对象,如果该第二对象的类型不存在于目标本体模板的对象字段中,将该第二对象的类型添加到目标本体模板的对象字段中。
可选的,所述第二对象的类型为:实体、实体涉及的事件信息、实体之间的关系或事件信息之间的关系。
可选的,所述对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的各个第二对象的步骤,包括:
确定所述目标数据中的非结构化数据中的词串;
从词性为名词的各个词串中,提取语义信息为预定语义信息的词串,作为实体,其中,预定语义信息为表征实体的语义信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910360257.0/2.html,转载请声明来源钻瓜专利网。