[发明专利]文本分类模型构建方法、装置、终端及存储介质在审

申请号：	201910113183.0	申请日：	2019-02-13
公开（公告）号：	CN109960726A	公开（公告）日：	2019-07-02
发明（设计）人：	徐亮;金戈;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62;G06K9/46
代理公司：	深圳市立智方成知识产权代理事务所(普通合伙) 44468	代理人：	王增鑫
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本分类模型构建卷积神经网络词向量存储介质接口设计调试神经网络技术终端面向对象模型设置文本分类文本训练训练数据嵌入层算法收敛打印分类灵活维护
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及神经网络技术领域，提供了一种文本分类模型构建方法、装置、终端及存储介质。所述文本分类模型构建方法包括：利用pytorch框架搭建卷积神经网络模型；其中，所述卷积神经网络模型设置于嵌入层；获取文本分类训练数据，利用Word2Vec算法将所述文本训练数据进行词向量训练，得到词向量；将所述词向量输入卷积神经网络模型进行分类训练，直至收敛时，得到文本分类模型。本发明的文本分类模型采用Pytorch框架，由于Pytorch框架面向对象的接口设计来源于torch，而torch的接口设计具有灵活易用的特点,并且PyTorch框架能够逐层打印出计算结果以便于调试，因此构建的文本分类模型更易于维护和调试。

技术领域

本发明涉及神经网络技术领域，尤其涉及一种文本分类模型构建方法、装置、终端及存储介质。

背景技术

随着移动互联网时代的到来，内容的生产和传播都发生了深刻的变化，为了满足信息爆炸背景下用户的多样化需求，迫切需要对文本信息进行有效的组织，文本分类是数据挖掘和信息检索领域研究的热点和核心技术。

现有的文本分类模型，如果要在文本分类问题上采用神经网络算法一般会采用tensorflow框架。但tensorflow框架代码冗长、接口设计过于晦涩难懂，导致构建的文本分类模型维护困难、调试不便、不易于操作。

发明内容

本发明提供一种文本分类模型构建方法、装置、终端及存储介质，以解决当前采用tensorflow框架构建文本分类模型时，因tensorflow框架代码冗长、接口设计过于晦涩难懂而导致构建的文本分类模型维护困难、调试不便、不易于操作的问题。

为解决上述问题，本发明采用如下技术方案：

本发明提供一种文本分类模型构建方法，包括如下步骤：

利用pytorch框架搭建卷积神经网络模型；其中，所述卷积神经网络模型设置于嵌入层；

获取文本分类训练数据，利用Word2Vec算法将所述文本训练数据进行词向量训练，得到词向量；

将所述词向量输入卷积神经网络模型进行分类训练，直至收敛时，得到文本分类模型。