[发明专利]多标签分类方法、装置、设备及计算机可读存储介质在审
申请号: | 202111586850.0 | 申请日: | 2021-12-23 |
公开(公告)号: | CN116361449A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 郑勇升 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/2415;G06F18/25;G06F18/22 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 韩金涛 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 分类 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请实施例提供一种多标签分类方法、装置、设备及计算机可读存储介质,方法包括:获取待分类的目标文本;提取目标文本的文本特征;根据文本特征以及已训练的标签特征得到融合特征;根据融合特征从预设标签中确定目标文本的目标分类标签。本申请实施例提供的多标签分类方法,在提取得到目标文本的文本特征后,会将文本特征和已训练好的标签特征进行融合,得到融合特征,相对于现有技术中是分别考虑目标文本的文本特征和各个标签特征之间的关联度来确定目标文本的标签分类结果,融合特征中还包含了各个标签特征之间的关联信息,从而后续利用该融合特征可以得到更准确的标签分类结果。
技术领域
本申请实施例涉及文本分类技术领域,具体涉及一种多标签分类方法、装置、设备及计算机可读存储介质。
背景技术
多标签分类是一种很常见的问题,在工业界中具有广泛应用,比如识别一张图片中有哪些物品,一段文本描述中包含了多少个标签等。
多标签分类通常会将目标文本打上多个不同的标签,也就是说各个标签之间并非是独立存在的,然而在常规的多标签分类技术中,例如以文本为例,仅仅只考虑到了文本的自身特征分别和各个标签特征之间的关联度,来实现对文本的多标签分类,导致多标签分类的效果不够理想,仍会存在一定的误判。
发明内容
本申请实施例提供一种多标签分类方法、装置、设备及计算机可读存储介质,旨在解决现有的多标签分类方法存在的分类效果不够理想的技术问题。
一方面,本申请实施例提供一种多标签分类方法,包括:
获取待分类的目标文本;
提取所述目标文本的文本特征;
根据所述文本特征以及已训练的标签特征得到融合特征;
根据所述融合特征从预设标签中确定所述目标文本的目标分类标签。
作为本申请的一种可选实施例,所述提取所述目标文本的文本特征的步骤,包括:
将所述目标文本输入已训练的分类模型中的特征提取层,得到所述目标文本的文本特征;
所述根据所述融合特征从预设标签中确定所述目标文本的目标分类标签的步骤,包括:
将所述融合特征输入所述分类模型中的预测层,得到所述目标文本对应预设标签的分类概率;
根据所述分类概率从所述预设标签中确定目标文本的目标分类标签。
作为本申请的一种可选实施例,所述将所述目标文本输入已训练的分类模型中的特征提取层,得到所述目标文本的文本特征的步骤之前,所述方法还包括:
获取初始分类模型、初始标签特征、训练文本以及所述训练文本对应的真实标签;
根据所述初始分类模型、所述初始标签特征,确定所述训练文本对应预设标签的预测概率;
根据所述预测概率和所述真实标签确定所述初始分类模型的损失值;
根据所述损失值对所述初始分类模型和所述初始标签特征进行训练,得到已训练的分类模型和已训练的标签特征。
作为本申请的一种可选实施例,所述根据所述初始分类模型、所述初始标签特征,计算得到所述训练文本对应预设标签的预测概率的步骤,包括:
将所述训练文本输入所述初始分类模型中的初始特征提取层,得到所述训练文本的训练文本特征;
根据所述训练文本特征以及所述初始标签特征得到训练融合特征;
将所述训练融合特征输入所述初始分类模型中的初始预测层,得到所述训练文本对应预设标签的预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111586850.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种户外环网柜防锈防凝露方法
- 下一篇:一种通信方法及装置