[发明专利]基于半监督学习的分类器训练方法及装置有效

申请号：	201910721182.4	申请日：	2019-08-06
公开（公告）号：	CN110414622B	公开（公告）日：	2022-06-24
发明（设计）人：	冯俊耀;肖燕珊;刘波;曾博;温劲;李鹏程;郝志峰	申请（专利权）人：	广东工业大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N20/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	李伟
地址：	510060 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及机器学习技术领域，特别是涉及一种基于半监督学习的分类器训练方法及装置。该方法包括：当接收到模型训练指令时，获取初始分类模型及各个携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据，生成训练数据集，将训练数据集输入初始分类模型触发其进行训练，训练结束后获得目标分类模型，并计算分类准确度；当分类准确度达到预设准确阈值，确定该目标分类模型为分类器。通过各种携带标签的样本数据和无标签样本数据，为初始分类模型提供更多的分类和识别信息，该初始分类模型可以根据各个样本数据学习每种数据对应的标签，以提高对各个数据进行识别和分类精度，提高分类器的性能。
搜索关键词：	基于监督学习分类训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于半监督学习的分类器训练方法，其特征在于，包括：当接收到用户发送的模型训练指令时，获取与所述模型训练指令对应的初始分类模型，并确定所述初始分类模型待分类的正类标签和负类标签，所述正类标签为数字字符的标签，所述负类标签为字母字符的标签；获取各个携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据，所述第三类标签包括除所述正类标签和所述负类标签之外的所有标签；依据各个所述携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据生成训练数据集；将所述训练数据集输入所述初始分类模型中，触发所述初始分类模型应用预先生成的训练算法，并依据所述训练数据集中的各个样本数据进行分类训练；当所述初始分类模型完成分类训练时，获得目标分类模型，并计算所述目标分类模型的分类准确度；判断所述分类准确度是否达到预先设置的准确阈值；当所述分类准确度达到预先设置的准确阈值时，将所述目标分类模型确定为分类器。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东工业大学，未经广东工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910721182.4/，转载请声明来源钻瓜专利网。

上一篇：基于多示例学习的分类器构建方法及装置
下一篇：基于多视角学习的分类模型构建方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于半监督学习的分类器训练方法及装置有效

专利文献下载