[发明专利]文本分类模型的训练方法、装置、电子设备和存储介质在审
| 申请号: | 202210288560.6 | 申请日: | 2022-03-23 | 
| 公开(公告)号: | CN114637851A | 公开(公告)日: | 2022-06-17 | 
| 发明(设计)人: | 王勇;龙睿;孙拔群;柴鹰;刘子玉;苏文博 | 申请(专利权)人: | 北京有竹居网络技术有限公司 | 
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06F40/30;G06N3/04;G06N3/08 | 
| 代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 王丹玉;汪海屏 | 
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文本 分类 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种文本分类模型的训练方法、装置、电子设备和存储介质,属于模型训练技术领域。文本分类模型的训练方法,包括:构建第一文本表征网络、第二文本表征网络和第三文本表征网络,第一文本表征网络与第二文本表征网络为语义相近的表征网络,第二文本表征网络与第三文本表征网络为语义不同的表征网络;将文本数据集输入至第一文本表征网络、第二文本表征网络和第三文本表征网络对文本分类模型进行训练,以得到训练后的文本分类模型。
技术领域
本申请属于模型训练技术领域,具体涉及一种文本分类模型的训练方法、装置、电子设备和存储介质。
背景技术
文本分类是自然语言处理最基本最重要的任务之一,它通过机器学习或深度学习方法训练模型后,用训练好的模型能够对短语、句子、段落、甚至文章等文本单元打上标签。
现有技术中,训练模型过程中均构建语义相近的特征表征,仅考虑到相同抛出值的特征表征网络构建的语义相近的样本,无法对构建语义不同的样本进行训练,导致文本分类模型的学习过程中无法对语义不同的样本进行充分训练学习,使训练得到的文本分类模型的精度较差。
发明内容
本申请实施例的目的是提供一种文本分类模型的训练方法、文本分类模型的训练装置、电子设备和可读存储介质,保证了文本分类模型学习过程中能够对语义不同的样本进行充分训练学习,使训练得到的文本分类模型的精度更高。
第一方面,本申请实施例提供了一种文本分类模型的训练方法,包括:构建第一文本表征网络、第二文本表征网络和第三文本表征网络,第一文本表征网络与第二文本表征网络为语义相近的表征网络,第二文本表征网络与第三文本表征网络为语义不同的表征网络;将文本数据集输入至第一文本表征网络、第二文本表征网络和第三文本表征网络对文本分类模型进行训练,以得到训练后的文本分类模型。
第二方面,本申请实施例提供了一种文本分类模型的训练装置,包括:构建模块,用于构建第一文本表征网络、第二文本表征网络和第三文本表征网络,第一文本表征网络与第二文本表征网络为语义相近的表征网络,第二文本表征网络与第三文本表征网络为语义不同的表征网络;训练模块,用于将文本数据集输入至第一文本表征网络、第二文本表征网络和第三文本表征网络对文本分类模型进行训练,以得到训练后的文本分类模型。
第三方面,本申请实施例提供了一种电子设备,包括处理器,存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面的文本分类模型的训练方法的步骤。
第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行程序或指令,实现如第一方面的文本分类模型的训练方法的步骤。
第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面的文本分类模型的训练方法。
本申请实施例中,在训练模型之前构建语义相近的第一文本表征网络和第二文本表征网络,以及构建语义不同的第三文本表征网络,通过对第一文本表征网络、第二文本表征网络和第三文本表征进行训练,充分考虑到了语义相近,以及语义不同的样本,保证了文本分类模型学习过程中能够对语义不同的样本进行充分训练学习,使训练得到的文本分类模型的精度更高。
附图说明
图1示出了本申请实施例提供的文本分类模型的训练方法的流程示意图之一;
图2示出了本申请实施例提供的文本分类模型的训练方法的流程示意图之二;
图3示出了本申请实施例提供的文本分类模型的训练方法的流程示意图之三;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210288560.6/2.html,转载请声明来源钻瓜专利网。





