[发明专利]基于主题注意力的深度学习文本分类模型训练方法在审

申请号：	202210312063.5	申请日：	2022-03-28
公开（公告）号：	CN114925197A	公开（公告）日：	2022-08-19
发明（设计）人：	张祖平;彭杰;龙哲	申请（专利权）人：	中南大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06N20/00
代理公司：	长沙轩荣专利代理有限公司 43235	代理人：	孙薇
地址：	410000 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于主题注意力深度学习文本分类模型训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例中提供了一种基于主题注意力的深度学习文本分类模型训练方法，属于计算技术领域，具体包括：根据原始文本构建文本数据集；得到文本的数字化表示、文本的掩盖序列、文本的数字标签；得到样本，并将样本分为训练集和验证集；初始化前向网络中变量；得到表征文本的一组词向量；得到原始注意力矩阵；得到目标注意力矩阵；根据目标注意力矩阵，得到概率矩阵；计算注意力头输出；得到注意力输出；计算主题输出；计算主题概率向量；计算交叉熵损失；计算前向网络变量的梯度；更新网络变量；迭代计算交叉熵损失以及梯度；当迭代达到预设次数或模型损失趋于稳定，迭代停止。通过本公开的方案提高了模型的并行性、稳定性、可视性和准确率。

技术领域

本公开实施例涉及计算技术领域，尤其涉及一种基于主题注意力的深度学习文本分类模型训练方法。

背景技术

目前，计算机以及互联网行业蓬勃发展，网络用户迅速增长，促进互联网企业以及网络用户更多的内容制作以及内容输出，并产生了大量的互联网数据。互联网数据包含大量文本数据，表现为内容繁多，形式多样。随着文本数据规模日趋庞大，相关企业处理面临的挑战也日益严峻。

文本规模的迅速增长，对文本处理工作提出了较高的要求。与传统的数据相比，网络中的文本数据具有许多新的特点，如数据量大、高度重复、高度冗余等。完全依靠人工处理这些信息的代价过大。文本分类是文本处理一项最为基础的任务，使用计算机快速高效的完成文本分类，有利于缓解信息高速增长带来的信息处理问题。

文本分类经历了从专家系统到机器学习算法再到深度学习算法的跨越。深度学习是机器学习中一种基于对数据进行表征学习的方法，其侧重于利用深度的神经网络，将模型处理得更为复杂，从而使模型对数据的理解更加深入。

深度学习文本分类模型目前主要以人工神经网络、卷积神经网络、循环神经网络为基础。这些网络搭建的模型为黑箱模型，其参数的解释性不高，不利于网络的优化以及实际的使用。同时，基于传统神经网络的文本分类模型在并发性、稳定性、训练速度、准确率等方面还有改进空间。

可见，亟需一种并发性、可解释性、稳定性、训练速度和准确率更高的基于主题注意力的深度学习文本分类模型训练方法。

发明内容

有鉴于此，本公开实施例提供一种基于主题注意力的深度学习文本分类模型训练方法，至少部分解决现有技术中存在并发性、可解释性、稳定性、训练速度和准确率较差的问题。

本公开实施例提供了一种基于主题注意力的深度学习文本分类模型训练方法，包括：

步骤1，获取原始文本，并根据所述原始文本构建文本数据集；