[发明专利]文本模型再训练的方法、装置、设备及存储介质在审
申请号: | 202110587698.1 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113360644A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 黄海龙 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;熊成龙 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 模型 训练 方法 装置 设备 存储 介质 | ||
本发明提供了一种文本模型再训练的方法、装置、设备及存储介质,包括:获取各所述弱标注的依据信息;根据所述依据信息拟合各个所述目标弱标注对应的所述无标数据的目标标签;将所述目标标签作为所述目标弱标注对应的所述无标数据的输出,并根据所述损失值调整所述文本模型中的参数。本发明的有益效果:根据弱标注的损失值以及依据信息拟合目标标签作为无标数据在文本模型中的输出,由于目标标签中目标标签只是对原模型的概率分布进行了调整,故而使误差不会累计,减少了再训练后的文本模型存在识别偏差的概率,使再训练的文本模型更加精确。
技术领域
本发明涉及人工智能领域,特别涉及一种文本模型再训练的方法、装置、设备及存储介质。
背景技术
为了提高文本模型弱标注的精确度,一般需要对训练好的文本模型进行再训练,以达到使模型更加精确的效果,目前自动再训练的方法主要是通过计算当前的损失值,并利用当前得到的弱标注和损失值对文本模型进行再训练,然这种再训练方式会随着文本模型不断的迭代训练,使得误差会不断积累,从而对文本模型造成识别偏差的问题。
发明内容
本发明的主要目的为提供一种文本模型再训练的方法、装置、设备及存储介质,旨在解决利用当前得到的弱标注和损失值对文本模型进行再训练,导致再训练后的文本模型存在识别偏差的问题。
本发明提供了一种文本模型再训练的方法,包括:
获取训练后的文本模型,对无标数据集合中的每个无标数据进行弱标注,并获取各所述弱标注的依据信息;其中,所述依据信息为无标数据在所述训练后的文本模型中的各预设类别的概率分布;
根据所述依据信息计算每一个所述弱标注的第一预测置信度;
判断所述第一预测置信度是否大于预设置信度值;
若大于所述预设置信度值,则计算所述目标弱标注的损失值,以及根据所述依据信息拟合各个所述目标弱标注对应的所述无标数据的目标标签;
将所述目标标签作为所述目标弱标注对应的所述无标数据的输出,将所述无标数据集合作为所述文本模型的输入,并根据所述损失值调整所述文本模型中的参数,以对所述文本模型再训练。
进一步地,所述根据所述依据信息计算每一个所述弱标注的第一预测置信度的步骤,包括:
从所述依据信息中提取所述无标数据在所述文本模型中各个类别的概率;
根据公式计算所述第一预测置信度;其中,E表示所述第一预测置信度,pi表示第i个所述无标数据在所述文本模型中对应弱标注的概率,n表示所述无标数据集合的无标数据数量。
进一步地,所述计算所述目标弱标注的损失值的步骤,包括:
获取所述无标数据集合中每个所述目标弱标注对应的所述无标数据的数据向量;
根据所述数据向量计算每两个所述数据向量之间的欧式距离;
根据所述欧式距离以及公式计算所述损失值,其中dij表示第i个无标数据和第j个无标数据对应数据向量之间的欧式距离,Vi表示第i个数据对应的数据向量,Vj表示第j个数据对应的数据向量,γ为常数,max(0,γ-dij)表示两者之间的最大值。
进一步地,所述将所述目标标签作为所述目标弱标注对应的所述无标数据的输出,将所述无标数据集合作为所述文本模型的输入,并根据所述损失值调整所述文本模型中的参数,以对所述文本模型再训练的步骤之后,还包括:
根据再训练后的所述文本模型对所述无标数据集合进行弱标注,并获取当前所述文本模型进行弱标注的依据信息;
根据当前所述文本模型进行弱标注的依据信息计算所述弱标注的第二预测置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110587698.1/2.html,转载请声明来源钻瓜专利网。