[发明专利]基于半监督学习的分类器训练方法及装置有效
申请号: | 201910721182.4 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110414622B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 冯俊耀;肖燕珊;刘波;曾博;温劲;李鹏程;郝志峰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器学习技术领域,特别是涉及一种基于半监督学习的分类器训练方法及装置。该方法包括:当接收到模型训练指令时,获取初始分类模型及各个携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据,生成训练数据集,将训练数据集输入初始分类模型触发其进行训练,训练结束后获得目标分类模型,并计算分类准确度;当分类准确度达到预设准确阈值,确定该目标分类模型为分类器。通过各种携带标签的样本数据和无标签样本数据,为初始分类模型提供更多的分类和识别信息,该初始分类模型可以根据各个样本数据学习每种数据对应的标签,以提高对各个数据进行识别和分类精度,提高分类器的性能。 | ||
搜索关键词: | 基于 监督 学习 分类 训练 方法 装置 | ||
【主权项】:
1.一种基于半监督学习的分类器训练方法,其特征在于,包括:当接收到用户发送的模型训练指令时,获取与所述模型训练指令对应的初始分类模型,并确定所述初始分类模型待分类的正类标签和负类标签,所述正类标签为数字字符的标签,所述负类标签为字母字符的标签;获取各个携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据,所述第三类标签包括除所述正类标签和所述负类标签之外的所有标签;依据各个所述携带正类标签的样本数据、携带负类标签的样本数据、携带第三类标签的样本数据和无标签样本数据生成训练数据集;将所述训练数据集输入所述初始分类模型中,触发所述初始分类模型应用预先生成的训练算法,并依据所述训练数据集中的各个样本数据进行分类训练;当所述初始分类模型完成分类训练时,获得目标分类模型,并计算所述目标分类模型的分类准确度;判断所述分类准确度是否达到预先设置的准确阈值;当所述分类准确度达到预先设置的准确阈值时,将所述目标分类模型确定为分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910721182.4/,转载请声明来源钻瓜专利网。