[发明专利]知识数据的处理方法和设备在审
申请号: | 201710354503.2 | 申请日: | 2017-05-18 |
公开(公告)号: | CN108959290A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 潘征;刘忠华;刘春辰 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 唐文静 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识数据 检测 结构化知识 方法和设备 参考 冲突检测 数据处理 准确率 推理 冲突 分析 | ||
本发明实施例提出了一种知识数据的处理方法和设备。所述方法包括:获取待检测的知识数据;分析待检测的知识数据,得到待检测的知识数据的结构化知识;检测待检测的知识数据与已有参考知识数据是否存在冲突。其中,所述检测包括将待检测的知识数据的结构化知识与根据两条或两条以上已有参考知识数据的结构化知识基于知识推理得到的结构化知识进行比较,以确定待检测的知识数据与已有参考知识数据是否存在冲突。根据本发明实施例的知识数据处理方法可以提高冲突检测的准确率。
技术领域
本发明一般地涉及数据处理技术领域,特别地涉及一种知识数据的处理方法和处理设备。
背景技术
随着互联网的发展,人们获取知识的渠道越来越丰富,除了各领域的专家知识库,各类互联网知识库也应运而生,如维基百科、百度百科等。专家知识库主要来自领域专家的自身经验,随着技术的发展面临着知识的更新。互联网知识库由互联网用户参与建立,有可能存在错误的知识。对于来自不同数据源的知识,同一知识主题的知识数据之间可能存在差异,甚至会存在彼此冲突或错误。
因此,在使用多个知识数据源中的知识数据构建知识库时,需要对其中的知识数据进行处理,检测出知识数据之间的冲突,排除错误的知识。
现有的技术在检测知识冲突时,通常考虑将新知识与知识库中的已有知识逐条对比检测,但没有考虑新知识与知识库中多条知识的组合之间存在冲突。因此,现有专利无法检测出新知识与知识库中知识的所有冲突,从而使得知识库中的知识数据准确率较低
因此,需要一种准确度更高的处理知识数据的机制。
发明内容
为了克服上述现有技术的至少一些缺陷,本发明实施例提出了一种知识数据的处理方法和设备,其在检测知识冲突时,不仅考虑了新知识与知识库中的各条已有知识之间是否存在冲突,而且考虑了新知识与知识库中的多条知识的组合之间是否存在冲突。因此,提高了冲突检测准确率。相应地,可以提高建成的知识库中的知识数据的准确率。
根据本发明的第一方面,提供了一种知识数据的处理方法。所述方法包括:获取待检测的知识数据;分析待检测的知识数据,得到待检测的知识数据的结构化知识;检测待检测的知识数据与已有参考知识数据是否存在冲突。其中,所述检测包括将待检测的知识数据的结构化知识与根据两条或两条以上已有参考知识数据的结构化知识基于知识推理得到的结构化知识进行比较,以确定待检测的知识数据与已有参考知识数据是否存在冲突。
在一些实施例中,所述方法还包括:在检测待检测的知识数据与已有参考知识数据是否存在冲突之前,根据预设的属性约束检测规则,确定待检测的知识数据的结构化知识是否满足预设的属性约束条件。
在一些实施例中,所述知识数据包括因果知识数据,所述知识推理包括因果知识推理,以及所述冲突包括因果关系冲突。
在一些实施例中,因果知识数据包括以下至少一种:
A→B,表示A是B的直接原因;
表示A不是B的直接原因;
A-B,表示A和B之间有直接的因果关系;
A⊥B,表示A和B不会相互影响;
表示A会影响B;
表示A不会影响B;
A~B,表示A和B是有关联的;
A≤B,表示在因果链上A的次序优先于B,
其中A表示因果知识数据中的主体,B表示因果知识数据中的客体,A和B之间的符号表示因果知识数据中的谓词。
在一些实施例中,因果知识推理包括以下中的至少一项:
根据已有参考知识数据A→B和B→C,推理得到A→B,B→C和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710354503.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网站类别获取方法和装置
- 下一篇:查询方法及相关装置