[发明专利]模型训练及调用方法、装置、计算机设备、存储介质有效
申请号: | 202111094266.3 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113780454B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 谢静文;阮晓雯;陈远旭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F18/214;G06F18/2415;G06N3/047;G06N3/08 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
地址: | 518057 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 调用 方法 装置 计算机 设备 存储 介质 | ||
1.一种指针网络模型训练方法,其特征在于,所述指针网络模型训练方法包括:
对样本语句集合中的每个样本语句进行至少一类标签标注,生成样本数据集;
将所述样本数据集中的样本数据输入指针网络模型,预测所述样本数据的每个字符对应每类标签的多个位置的概率;
从预测的多个概率中确定每类标签的每个位置的最高概率,并根据每类标签的每个位置的所述最高概率,计算所述指针网络模型的损失函数值;
对所述指针网络模型进行迭代优化,并返回执行所述将所述样本数据集中的样本数据输入指针网络模型,预测所述样本数据的每个字符对应每类标签的多个位置的概率的步骤,直至基于计算得到的所述损失函数值确定所述指针网络模型收敛,获得训练好的所述指针网络模型。
2.根据权利要求1所述的指针网络模型训练方法,其特征在于,所述根据每类标签的每个位置的所述最高概率,计算所述指针网络模型的损失函数值,包括:
获取所述样本数据对应的每类标签的每个位置的惩罚系数;
根据每类标签的每个位置的所述惩罚系数,以及每类标签的每个位置的所述最高概率,计算所述指针网络模型的所述损失函数值。
3.根据权利要求2所述的指针网络模型训练方法,其特征在于,所述根据每类标签的每个位置的所述惩罚系数,以及每类标签的每个位置的所述最高概率,计算所述指针网络模型的所述损失函数值,包括:
按照计算公式:
计算所述损失函数值;
其中,Loss代表损失函数值,n代表标签的类型数量,m代表Log函数的底数,αi,start代表第i类标签的起始位置的惩罚系数,αi,end代表第i类标签的结束位置的惩罚系数,αi,other代表第i类标签的其他位置的惩罚系数,Pi,start代表第i类标签的起始位置的最高概率,Pi,end代表第i类标签的结束位置的最高概率,Pi,other代表第i类标签的其他位置的最高概率。
4.根据权利要求1所述的指针网络模型训练方法,其特征在于,所述指针网络模型中的指针层数与标签的类型数量一致,每一类标签对应所述指针网络模型的一层指针。
5.根据权利要求1至4任一项所述的指针网络模型训练方法,其特征在于,所述对样本语句集合中的每个样本语句进行至少一类标签标注,包括:
确定每个所述样本语句对应的至少一类标签;
对每个所述样本语句的每类标签进行标签的起始位置、结束位置标注。
6.一种指针网络模型调用方法,其特征在于,所述指针网络模型为采用如权利要求1至5中任一项所述的指针网络模型训练方法训练得到的指针网络模型,所述指针网络模型调用方法包括:
获取待处理的症状描述语句;
将所述症状描述语句输入所述指针网络模型,预测所述症状描述语句的每个字符对应每类标签的多个位置的概率;
根据每类标签的起始位置的最高概率对应的第一字符、以及每类标签的结束位置的最高概率对应的第二字符,从所述症状描述语句中提取出以所述第一字符开始至所述第二字符结束的字符段;
根据每类标签对应的所述字符段,确定所述症状描述语句对应每类标签的症状信息,以基于所述症状信息,生成症状标准表述语句。
7.一种指针网络模型训练装置,其特征在于,包括:
标签标注模块,用于对样本语句集合中的每个样本语句进行至少一类标签标注,生成样本数据集;
训练模块,用于将所述样本数据集中的样本数据输入指针网络模型,预测所述样本数据的每个字符对应每类标签的多个位置的概率;
计算模块,用于从预测的多个概率中确定每类标签的每个位置的最高概率,并根据每类标签的每个位置的所述最高概率,计算所述指针网络模型的损失函数值;
第一处理模块,用于对所述指针网络模型进行迭代优化,直至基于计算得到的所述损失函数值确定所述指针网络模型收敛,获得训练好的所述指针网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111094266.3/1.html,转载请声明来源钻瓜专利网。