[发明专利]一种基于元学习的中医舌色域自适应分类方法在审
| 申请号: | 202211009174.5 | 申请日: | 2022-08-22 |
| 公开(公告)号: | CN115457310A | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 卓力;张雷;贾童瑶;李艳萍;张辉;李晓光 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/56;G06V10/82 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 王兆波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 学习 中医 舌色域 自适应 分类 方法 | ||
1.一种基于元学习的中医舌色域自适应分类方法,其特征在于:首先,使用ResNet18作为分类骨干网络,利用源域的有标注数据构建元训练和元测试任务,对ResNet18进行预训练;然后,使用目标域少量标注样本对源域预训练的模型进行微调,使其快速适应目标域样本数据的特点;利用微调后的模型对目标域的未标注数据进行分类,将分类预测结果作为伪标签;接下来,从中挑选出高质量的伪标签,作为标注数据,对目标域的分类模型进行微调,得到目标域的舌色分类模型;对于剩余的未标注数据,重复上述过程,最终得到一个高精度的目标域舌色分类模型。
2.根据权利要求1所述的一种基于元学习的中医舌色域自适应分类方法,其特征在于:包括构建源域和目标域舌色分类数据集、基于元学习的源域舌色分类网络训练、目标域网络模型微调与高质量伪标签生成、目标域舌色分类模型训练4个步骤;
步骤1:构建源域和目标域舌色分类数据集;
使用2台SIPL型中医舌象仪采集舌图像,利用2台舌象仪采集的设图像构建了SIPL-A和SIPL-B数据集,分别作为源域数据集和目标域数据集;
步骤2:基于元学习的源域舌色分类网络训练;
使用ResNet18作为元学习的骨干网络,利用源域的有标注数据构建元训练和元测试任务,对ResNet18进行训练,学习到源域舌色分类的元知识;
步骤3:目标域网络模型微调与高质量伪标签生成;
使用目标域少量标注样本对源域预训练的模型进行微调,使其快速适应目标域样本数据的特点;利用该模型对目标域的未标注数据进行分类,将分类预测结果作为伪标签;从中挑选出高质量的伪标签,形成标注数据样本;
步骤4:目标域舌色分类模型训练;
使用目标域少量标注样本和步骤3得到的高质量的伪标签对目标域的分类模型进行微调,得到目标域的舌色分类模型;
对于剩余的未标注数据,重复步骤3、步骤4,最终得到一个高精度的目标域舌色分类模型。
3.根据权利要求2所述的一种基于元学习的中医舌色域自适应分类方法,其特征在于:元学习中的数据集分为元训练集和元测试集,二者又将数据集进一步划分为支持集和查询集;
在元训练阶段,训练集表示为D={(x1,y1),…,(xN,yN)},其中N是训练集D的类别数,x是训练样本,y是对应的标签;将训练集D划分成多个K-way C-shot的元任务,K-way C-shot代表从训练集D中随机选取K个类别、且每个类中再任选C个样本,从而形成支持集和查询集;
在元测试阶段,支持集的形成与训练阶段的支持集类似,查询集则由剩余的样本组成,利用训练好的模型对查询集的样本进行预测;
对于元学习来说,网络模型经过训练,将学习一个嵌入函数,将同一类的所有输入样本映射到特征空间中的平均向量,作为每个类的描述符;对于类别k,通过训练样本的嵌入特征的质心来表示,具体公式如下:
其中S为支持集,f(xi)表示由ResNet18提取到的特征向量,Sk是类别k的样本数量;基于度量学习方法,采用欧式距离作为距离函数,在查询集Q的所有类上给定一个查询样本q生成分布:
p(y=k|q)本质上是对查询集样本嵌入函数f(q)与对应类质心ck之间的欧氏距离d(f(q),ck)进行Softmax处理,损失函数采用交叉熵函数,具体公式如下:
L=-logp(y=k|q) (3)
因此,元学习阶段的损失函数表示为:
其中ck为第k类质心,ck'为除了第k类其它类质心,d(f(q),ck)表示查询集样本嵌入函数f(q)与对应类质心ck之间的欧氏距离;即利用支持集计算出各个类别的质心ck,从查询集给定一个查询样本q,计算每个样本到各个类质心之间距离,进而计算每个类的概率,距离越小属于该类的概率越大。
4.根据权利要求1所述的一种基于元学习的中医舌色域自适应分类方法,其特征在于:步骤3中,利用目标域的有标注样本,以元学习的方式对步骤2得到的预训练模型进行微调,微调的元学习过程同步骤2,区别在于使用目标域的有标注样本进行训练和测试;利用微调好的模型对目标域大量的未标注样本进行预测,将预测结果作为伪标签;设定伪标签的阈值δ,当伪标签p(y=k|q)满足:p(y=k|q)δ时,则认为该标签为高质量的;将该伪标签作为样本的标签,作为标注数据用于网络训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211009174.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种挤出管材高精度在线检测设备
- 下一篇:一种自监控无线物联网电能表





