[发明专利]知识提取方法、装置、设备和存储介质在审
| 申请号: | 202111175771.0 | 申请日: | 2021-10-09 |
| 公开(公告)号: | CN113935326A | 公开(公告)日: | 2022-01-14 |
| 发明(设计)人: | 谢韬;秦昌博 | 申请(专利权)人: | 科沃斯商用机器人有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;孙明子 |
| 地址: | 215104 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 提取 方法 装置 设备 存储 介质 | ||
本发明实施例提供一种知识提取方法、装置、设备和存储介质,该方法包括:获取待提取语句和多个属性关系,其中,属性关系用于描述待提取语句中不同实体之间的联系;确定待提取语句和每个属性关系的相关度;基于相关度,在多个属性关系中确定待提取语句包含的目标属性关系;将目标属性关系和待提取语句输入到阅读理解模型中,基于阅读理解模型输出的结果确定待提取语句中具有目标属性关系的实体;输出具有目标属性关系的实体以及目标属性关系。采用本发明,可以基于待提取语句和属性关系的语义准确地从待提取语句中提取出具有目标属性关系的实体和目标属性关系,知识提取的灵活性高且提取结果的准确性高。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种知识提取方法、装置、设备和存储介质。
背景技术
相关技术中,可以通过知识提取的方式提取出待提取语句中的实体之间的属性关系,根据提取结果输出三元组,其中,三元组由第一实体、第二实体和两实体之间的属性关系构成。例如,对于“中国的首都是北京”这条待提取语句,可以输出三元组中国,首都,北京,其中,“中国”为第一实体,“北京”为第二实体,“首都”为“中国”和“北京”之间的属性关系。能够成功在待提取语句中提取出三元组的前提是待提取语句需要通过限定的句式结构进行编辑。然而实际应用中信息编辑的方式多种多样,如果待提取语句不是按照限定的句式结构编辑的,则难以在待提取语句中提取出三元组,相关技术中知识提取的方式灵活性较差。
发明内容
本发明实施例提供一种知识提取方法、装置、设备和存储介质,用以实现提高知识提取的灵活性。
第一方面,本发明实施例提供一种知识提取方法,该方法包括:
获取待提取语句和多个属性关系,其中,所述属性关系用于描述所述待提取语句中不同实体之间的联系;
确定所述待提取语句和每个属性关系的相关度;
基于所述相关度,在所述多个属性关系中确定所述待提取语句包含的目标属性关系;
将所述目标属性关系和所述待提取语句输入到阅读理解模型中,基于所述阅读理解模型输出的结果确定所述待提取语句中具有所述目标属性关系的实体;
输出具有所述目标属性关系的实体以及所述目标属性关系。
第二方面,本发明实施例提供一种知识提取装置,包括:
获取模块,用于获取待提取语句和多个属性关系,其中,所述属性关系用于描述所述待提取语句中不同实体之间的联系;
计算模块,用于确定所述待提取语句和每个属性关系的相关度;
确定模块,用于基于所述相关度,在所述多个属性关系中确定所述待提取语句包含的目标属性关系;
提取模块,用于将所述目标属性关系和所述待提取语句输入到阅读理解模型中,基于所述阅读理解模型输出的结果确定所述待提取语句中具有所述目标属性关系的实体;
输出模块,用于输出具有所述目标属性关系的实体以及所述目标属性关系。
第三方面,本发明实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第一方面中的知识提取方法。
第四方面,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现第一方面中的知识提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科沃斯商用机器人有限公司,未经科沃斯商用机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111175771.0/2.html,转载请声明来源钻瓜专利网。





