[发明专利]推理模型的训练方法、推理方法及装置在审
申请号: | 202110854886.6 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113590782A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 庞超;王硕寰;孙宇;李芝 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/237;G06N5/04 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推理 模型 训练 方法 装置 | ||
1.一种推理模型的训练方法,包括:
从知识图谱中采样环状子图;
生成所述环状子图对应的推理语句;以及
以所述推理语句为训练样本,训练推理模型。
2.根据权利要求1所述的方法,其中,所述环状子图包括至少三个三元组,并且
其中,生成所述环状子图对应的推理语句包括:
分别生成所述至少三个三元组中的每一个三元组对应的子句;以及
将所述至少三个三元组各自对应的子句进行拼接,得到所述推理语句。
3.根据权利要求2所述的方法,其中,所述三元组包括第一实体、第二实体、以及所述第一实体与所述第二实体的关系,并且
其中,分别生成所述至少三个三元组中的每一个三元组对应的子句包括:
获取预设的模板,所述模板包括用于填充第一实体的第一槽位、用于填充第一实体与第二实体的关系的第二槽位、以及用于填充第二实体的第三槽位;以及
将三元组的第一实体、第一实体与第二实体的关系、以及第二实体填充至所述模板的相应槽位中,得到所述三元组对应的子句。
4.根据权利要求2所述的方法,其中,所述三元组包括第一实体、第二实体、以及所述第一实体与所述第二实体的关系,并且,
其中,分别生成所述至少三个三元组中的每一个三元组对应的子句包括:
将三元组的所述第一实体、所述关系、所述第二实体进行拼接,得到所述三元组对应的子句。
5.根据权利要求2-4中任一项所述的方法,其中,所述推理语句中的相邻的两个子句由分隔符分隔开。
6.根据权利要求1-5中任一项所述的方法,其中,以所述推理语句为训练样本,训练推理模型包括:
将所述推理语句中的一个元素替换为预设的掩码,得到问题语句,其中,所述元素来源于所述环状子图;
将所述问题语句输入所述推理模型,并获得所述推理模型输出的预测答案;以及
基于所述元素和所述预测答案,调整所述推理模型的参数。
7.根据权利要求6所述的方法,其中,所述元素为所述环状子图中的任一个三元组的第一实体、第二实体、或第一实体与第二实体的关系。
8.根据权利要求根据权利要求6或7所述的方法,其中,所述推理语句包括多个子句,每个子句对应于所述环状子图中的一个三元组,所述元素位于所述推理语句的最后一个子句中。
9.一种推理方法,包括:
将问题文本输入推理模型,其中,所述推理模型为根据权利要求1-8中任一项所述的方法训练得到;以及
获取所述推理模型输出的所述问题文本对应的答案。
10.根据权利要求9所述的推理方法,还包括:
获取用户输入的问题文本,所述问题文本包括多个实体以及所述多个实体之间的关系。
11.一种推理模型的训练装置,包括:
采样模块,被配置为从知识图谱中采样环状子图;
生成模块,被配置为生成所述环状子图对应的推理语句;以及
训练模块,被配置为以所述推理语句为训练样本,训练推理模型。
12.根据权利要求11所述的装置,其中,所述环状子图包括至少三个三元组,并且
其中,所述生成模块包括:
子句生成单元,被配置为分别生成所述至少三个三元组中的每一个三元组对应的子句;以及
拼接单元,被配置为将所述至少三个三元组各自对应的子句进行拼接,得到所述推理语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110854886.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泡沫高空灭火系统
- 下一篇:一种校准五轴系统TCP参数的方法