[发明专利]一种多标签分类模型训练方法在审

申请号：	202210416556.3	申请日：	2022-04-20
公开（公告）号：	CN115329828A	公开（公告）日：	2022-11-11
发明（设计）人：	邓彪	申请（专利权）人：	中科凡语（武汉）科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	湖北权上知识产权代理事务所(特殊普通合伙) 42287	代理人：	范瑞鹏
地址：	430000 湖北省武汉市洪山区关***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种标签分类模型训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种多标签分类模型训练方法，输入训练集X＝{(x₁，l₁)，(x₂，l₂)，…，(x_n，l_n)}，输入单二进制分类器序列C＝{c₁，c₂，…，c_n}，输入顺序集K＝{k₁，k₂，…，k_n}；用训练集X训练分类器序列C产生的0/1序列拼接到训练集X的尾部产生新的训练集U，用新训练集U训练分类器序列C产生新分类器序列CC＝{cc₁，cc₂，…，cc_n‑1}；cc₁，…，cc_k在分类器之间传递标签信息，cc₁，…，cc_k考虑了标签之间的相关性，从而克服诸如二元关联这类方法中出现的标签独立性问题，并且本发明仍保留有二元关联方法的优势，包括低内存使用量和低运行时间复杂性。虽然平均|L|/2个特性添加到每个实例，因为|L|在实践中总是有限的，所以，对复杂性的后果微乎其微。

技术领域

本发明涉及深度学习模型技术领域，特别是涉及一种多标签分类模型训练方法。

背景技术

深度学习模型发展进程中，传统数据挖掘单标签分类技术也称为多类分类技术，它由已知的有限标签集L将实例x与单个标签1关联在一起。单标签数据集D为{(x₁，l₁)，…，(x_n，l_n)}；多标签分类S是L的一个真子集，即S中的元素为{(x₁，S₁)，…，(x_n，S_n)}。多标签分类技术受到越来越多的关注，并且众多领域得到应用，比如在文本分类、基因组合等领域的应用。

多标签分类比较常见的技术方案是把多标签分类问题转化为单标签分类问题，或把多标签问题转化为多个单标签分类问题。这种技术方案可以使用单标签分类器进行单标签分类，然后这些分类器将转换为多标签表示，而实现这种技术方案的方法有：朴素贝叶斯法、支持向量机和K-最邻近算法。

纵观这些技术方案，多标签分类问题转化为单标签分类问题的本质还是应用单标签分类技术，而在转化过程中，由于对现有算法的修改、叠加、嵌套调用使整个训练模型复杂度增加了数倍，效率也降低了数倍；如果标签集L规模庞大，转化技术基本没有实际使用意义。这种实际情况给这些应用领域的人们应用标签分类技术造成很大的应用困扰。

由此可以看出，现有多标签分类模型训练方法以单标签分类模型训练方法转化的方案存在实际应用缺陷，即对传统单标签分类技术的修修改改已不能满足大数据集，大数据量等标签分类模型的应用。

发明内容

鉴于以上所述现有技术的缺点和使用者实际需求，本发明的目的在于提供一种多标签分类模型训练方法，用于解决现有技术中存在的问题，并能应用于数据集规模较大的标签集L。

为实现上述目的及其他相关目的，本发明采用的技术方案如下：

一种多标签分类模型训练方法，包括步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中科凡语（武汉）科技有限公司，未经中科凡语（武汉）科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210416556.3/2.html，转载请声明来源钻瓜专利网。