[发明专利]文本分类方法和装置在审

申请号：	202010466025.6	申请日：	2020-05-28
公开（公告）号：	CN111611386A	公开（公告）日：	2020-09-01
发明（设计）人：	孟亚洲;史腾飞	申请（专利权）人：	北京学之途网络科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06N3/08
代理公司：	北京超成律师事务所 11646	代理人：	刘静
地址：	100000 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本分类方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提出一种文本分类方法和装置，涉及自然语言处理技术领域。该文本分类方法包括：获取待测文本；将待测文本输入预先训练的分类模型，分类模型包括特征提取网络和分类网络，分类网络包括多个分类器；利用特征提取网络从待测文本中提取得到多个文本特征信息；将多个文本特征信息一一对应输入分类网络的多个分类器进行分类处理，得到每个分类器的概率值；依据每个分类器的概率值得到待测文本的分类结果。本发明实施例提出的文本分类方法和装置具有准确率和效率高的优点。

技术领域

本发明涉及自然语言处理技术领域，具体而言，涉及一种文本分类方法和装置。

背景技术

多标签文本分类是自然语言处理的核心研究领域，也是实现智能系统的关键技术。传统的多标签文本处理方法是对每一个标签做一个二分类器，然后将所有的二分类器进行融合，最终计算得出所有的类别标签。该方法在类别标签增多时，难以实现，且模型过多时，算法效率会严重下降。

发明内容

有鉴于此，本发明的目的在于提供一种文本分类方法和装置，其具有准确率和效率高的优点。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，实施例提供一种文本分类方法，所述方法包括：

获取待测文本；

将所述待测文本输入预先训练的分类模型，所述分类模型包括特征提取网络和分类网络，所述分类网络包括多个分类器；

利用所述特征提取网络从所述待测文本中提取得到多个文本特征信息；

将所述多个文本特征信息一一对应输入所述分类网络的多个分类器进行分类处理，得到每个所述分类器的概率值；