[发明专利]神经网络训练方法、文本分类方法及文本分类系统在审
| 申请号: | 202210676061.4 | 申请日: | 2022-06-15 |
| 公开(公告)号: | CN115080737A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 曾祥云;朱姬渊 | 申请(专利权)人: | 上海易康源医疗健康科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 杨用玲 |
| 地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 训练 方法 文本 分类 系统 | ||
1.一种神经网络训练方法,其特征是,包括步骤:
S1:准备数据集:源域文本和目标域文本;
S2:将源数据输入到源域神经网络中,提取源文本的特征;
S3:对源文本的特征进行分类,得到源域分类标签;
S4:根据源文本以及源域分类标签和目标文本进行训练,得到目标域的分类标签。
2.如权利要求1所述的神经网络训练方法,其特征是,步骤S4:根据源文本以及源域分类标签和目标文本进行训练,得到目标域的分类标签包括:
将源域神经网络训练得到的参数作为目标域神经网络训练的初始化参数;
分别将源域文本和目标域文本输入至各自的神经网络中进行特征提取;
根据提取的源域文本特征和目标域文本的特征进行训练,获得目标域的分类标签。
3.如权利要求2所述的神经网络训练方法,其特征是,所述根据提取的源域文本特征和目标域文本的特征进行训练,采用对抗的方法进行训练。
4.如权利要求1或2所述的神经网络训练方法,其特征是,所述源域神经网络或目标域神经网络为基于bert构建的神经网络。
5.如权利要求1所述的神经网络训练方法,其特征是,在步骤S4中还包括对源域神经网络和目标域神经网络的参数进行压缩处理。
6.如权利要求5所述的神经网络训练方法,其特征是,对源域神经网络和目标域神经网络的参数进行压缩处理的方法为知识蒸馏。
7.一种文本分类方法,包括步骤:
接收输入的文本;
神经网络模型对文本进行特征提取并分类;
返回输出结果,
其特征是,所述神经网络为权利要求1至6之任一神经网络训练方法得到的神经网络模型。
8.一种文本分类系统,包括交互单元、处理模块,其中:
交互单元用以接收输入的文本;
处理模块用以对输入的文本进行处理并向交互单元返回分类结果,
其特征是,所述处理模块为权利要求1至6之任一神经网络训练方法得到的神经网络模型。
9.一种计算机可读存储介质,所述存储介质中存储有指令或者程序,其特征是,所述指令或者程序由处理器加载并执行如权利要求7所述的文本分类方法。
10.一种电子设备,其特征是,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求7所述的文本分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海易康源医疗健康科技有限公司,未经上海易康源医疗健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210676061.4/1.html,转载请声明来源钻瓜专利网。





