[发明专利]知识提取方法、装置、设备和存储介质在审
| 申请号: | 202111175771.0 | 申请日: | 2021-10-09 |
| 公开(公告)号: | CN113935326A | 公开(公告)日: | 2022-01-14 |
| 发明(设计)人: | 谢韬;秦昌博 | 申请(专利权)人: | 科沃斯商用机器人有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;孙明子 |
| 地址: | 215104 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 提取 方法 装置 设备 存储 介质 | ||
1.一种知识提取方法,其特征在于,包括:
获取待提取语句和多个属性关系,其中,所述属性关系用于描述所述待提取语句中不同实体之间的联系;
确定所述待提取语句和每个属性关系的相关度;
基于所述相关度,在所述多个属性关系中确定所述待提取语句包含的目标属性关系;
将所述目标属性关系和所述待提取语句输入到阅读理解模型中,基于所述阅读理解模型输出的结果确定所述待提取语句中具有所述目标属性关系的实体;
输出具有所述目标属性关系的实体以及所述目标属性关系。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待提取语句和每个属性关系的相关度,包括:
将所述待提取语句输入到第一机器学习模型中,得到所述待提取语句对应的语句向量;
获取所述多个属性关系分别对应的关系向量,其中,所述关系向量是预先将所述多个属性关系分别输入到第二机器学习模型中得到的;
确定所述语句向量与各关系向量分别对应的距离,作为所述待提取语句和各属性关系分别对应的相关度。
3.根据权利要求2所述的方法,其特征在于,所述基于所述相关度,在所述多个属性关系中确定所述待提取语句包含的目标属性关系,包括:
在所述各关系向量中,确定与所述语句向量的距离符合预设条件的预设数量的目标关系向量;
将所述目标关系向量对应的属性关系确定为所述待提取语句包含的目标属性关系。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标属性关系和所述待提取语句输入到阅读理解模型中,基于所述阅读理解模型输出的结果确定所述待提取语句中具有所述目标属性关系的实体,包括:
将所述目标属性关系和所述待提取语句输入到阅读理解模型中,得到所述待提取语句中每个字元成为第一实体的起始字元、所述第一实体的结束字元、第二实体的起始字元以及所述第二实体的结束字元的概率,其中,所述第一实体和所述第二实体是具有所述目标属性关系的实体;
基于所述待提取语句中每个字元成为所述第一实体的起始字元、所述第一实体的结束字元、所述第二实体的起始字元以及所述第二实体的结束字元的概率,确定所述待提取语句中具有所述目标属性关系的实体。
5.根据权利要求4所述的方法,其特征在于,所述基于所述待提取语句中每个字元成为所述第一实体的起始字元、所述第一实体的结束字元、所述第二实体的起始字元以及所述第二实体的结束字元的概率,确定所述待提取语句中具有所述目标属性关系的实体,包括:
基于所述待提取语句中的字元生成第一实体候选集以及第二实体候选集,其中,所述第一实体候选集包括至少一个候选实体,所述第二实体候选集包括至少一个候选实体;
基于所述待提取语句中每个字元成为所述第一实体的起始字元、所述第一实体的结束字元、所述第二实体的起始字元以及所述第二实体的结束字元的概率,在所述第一实体候选集中确定所述第一实体,在所述第二实体候选集中确定所述第二实体。
6.根据权利要求5所述的方法,其特征在于,所述基于所述待提取语句中的字元生成第一实体候选集以及第二实体候选集,包括:
对于所述待提取语句中的目标字元,将所述目标字元确定为所述候选实体的起始字元,将所述待提取语句中除所述目标字元之外的字元依次确定为所述候选实体的结束字元,得到第一实体候选集和第二实体候选集,其中,所述目标字元为所述待提取语句中的任一字元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科沃斯商用机器人有限公司,未经科沃斯商用机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111175771.0/1.html,转载请声明来源钻瓜专利网。





