[发明专利]多标签分类模型训练方法和设备在审
申请号: | 201910084518.0 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109886143A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 马永培;熊健皓;赵昕;和超;张大磊 | 申请(专利权)人: | 上海鹰瞳医疗科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京华仁联合知识产权代理有限公司 11588 | 代理人: | 苏雪雪 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签分类 输出向量 合并 样本 标签 向量 标签确定 模型训练 方法和设备 类别确定 反馈 分类 | ||
本发明提供一种多标签分类模型训练方法,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。
技术领域
本发明涉及人工智能领域,具体涉及一种多标签分类模型训练方法和设备。
背景技术
利用机器学习算法和模型对目标进行识别是一种高效的智能识别方式,也是诸如自动驾驶、智能摄像、机器人等众多领域的底层技术。
多标签,即MultiLabel,指的是一个样本可能同时属于多个类,即有多个标签。比如一件L尺寸的棉服,则该样本就有至少两个标签——型号:L,类型:冬装。利用多标签样本对机器学习模型进行训练可以得到多标签分类模型,这种模型可以对一个目标进行识别,输出的识别结果可以是一个向量,用于表达该目标所属的类别。
在很多现实应用场景中,被识别的目标本身具有多种具体的类别,而这些具体类别中又有一部分同属于一个大类。例如对于眼底图像而言,其本身可以属于糖网轻度、糖网中度、糖网重度、糖网增殖期、静脉阻塞、动脉阻塞、青光眼、豹纹样病变这8种具体类别,而其中糖网轻度、糖网中度、糖网重度、糖网增殖期这4种具体类别都属于糖网疾病这一个大类。利用多标签分类模型对这种眼底图像进行识别时,如果模型输出的结果表示该图像属于糖网轻度,但实际上该图像属于糖网重度,这种错误的分类结果是可以被接收的结果;但若模型输出的结果表示该图像属于青光眼,则这种错误不可被接受。
在现有的多标签分类模型训练方案中,当模型对样本的识别结果与标签不一致时,将根据二者的差别确定一个损失值,然后模型会根据该损失值调整自身的参数以提高性能。但是这种训练方案没有考虑到可接受的错误与不可接受的错误的差别,根据对所有具体类别的识别结果调整参数,会使模型输出类别缩小,由此降低了模型的性能。
发明内容
有鉴于此,本发明提供一种多标签分类模型训练方法,包括:
利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;
对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;
根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;
根据所述第一损失值和所述第二损失值确定第三损失值;
向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。
可选地,所述输出向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别的置信度。
可选地,对所述输出向量进行处理得到合并向量,包括:
在所述多个数值中提取设定的部分数值合并为一个数值;
利用合并后的数值和未被提取的数值形成所述合并向量。
可选地,所述第一标签为第一目标向量,所述第一目标向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海鹰瞳医疗科技有限公司,未经上海鹰瞳医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910084518.0/2.html,转载请声明来源钻瓜专利网。