[发明专利]分类模型确定方法、装置、设备及存储介质在审

申请号：	202210253330.6	申请日：	2022-03-15
公开（公告）号：	CN114676251A	公开（公告）日：	2022-06-28
发明（设计）人：	刘建国;王迪;朱毅	申请（专利权）人：	青岛海尔科技有限公司;海尔智家股份有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06K9/62
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	高益秀;臧建明
地址：	266101 山东省***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分类模型确定方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供的一种分类模型确定方法、装置、设备及存储介质，通过获取至少两个类别以及类别下的文本数据信息，得到原始训练集文本数据信息；对原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，待添加的特征向量表征原始训练集文本数据信息的特征；将待添加的特征向量添加至基准分类模型中，得到校准分类模型；其中，基准分类模型是由原始训练集文本数据信息训练得到的。采用本技术方案，能够提升文本分类的精准度。

技术领域

本申请涉及机器学习技术领域，尤其涉及一种分类模型确定方法、装置、设备及存储介质。

背景技术

文本分类是指对给出的文本给出一个或者多个类别标号，对文本进行比较准确或者高效地分类，文本分类常用于数据管理任务中，对于文本进行分类，可以使用户方便地浏览文本，并且可以通过文本类别来查询所需的文本。

但是，目前的文本分类采用的算法会出现分类精准度比较低的情况，因此，亟需一种文本分类算法，能够提升文本分类的精准度。

发明内容

本申请提供一种分类模型确定方法、装置、设备及存储介质，能够提升文本分类的精准度。

第一方面，本申请提供一种分类模型确定方法，包括：

获取至少两个类别以及所述类别下的文本数据信息，得到原始训练集文本数据信息；

对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征；

将所述待添加的特征向量添加至基准分类模型中，得到校准分类模型；其中，所述基准分类模型是由所述原始训练集文本数据信息训练得到的。

在一个示例中，对所述原始训练集文本数据信息进行特征处理，得到待添加的特征向量；其中，所述待添加的特征向量表征所述原始训练集文本数据信息的特征，包括：