[发明专利]一种基于表示学习和迁移学习的领域适配方法在审
| 申请号: | 201911084862.6 | 申请日: | 2019-11-08 |
| 公开(公告)号: | CN110837865A | 公开(公告)日: | 2020-02-25 |
| 发明(设计)人: | 李佳珍;袁晓光;王泊涵;戴志明;李墈婧;韩涛;谢德鹏 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 王雪芬 |
| 地址: | 100854*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 表示 学习 迁移 领域 配方 | ||
本发明涉及一种基于表示学习和迁移学习的领域适配方法,属于大数据和物联网技术领域。本发明提出的基于表示学习和迁移学习的领域适配方法是基于源域的少量真实标签实现,从而减少对有标签数据的依赖。通过Center Loss与Softmax Loss联合损失函数嫩刚使得源域的数据特征扩大类间距,缩小类内距,从而获得源域的可分离的特征。通过定义源域特征和目标域特征之间的距离的损失函数即MMD Loss损失函数,能够再通过神经网络的训练过程降低MMD Loss损失函数的值,从而拉近源域和目标域的距离,最终提高目标域的准确率。
技术领域
本发明属于大数据和物联网技术领域,具体涉及一种基于表示学习和迁移学习的领域适配方法。
背景技术
随着大数据和物联网的发展,研究人员使用深度学习模型处理大数据问题的比例越来越大。深度学习模型通过端到端的神经网络结构自动提取高层次的数据特征,从而代替了机器学习算法中手动提取特征的步骤,这种自动提取特征的方法在识别准确率上也有明显的提升。其中,卷积神经网络(Convolutional Neural Network,CNN),依赖网络的平移不变性、局部连接、权值共享的特点,通过卷积层和池化层来提取数据特征,并通过Softmax层对数据进行分类。在图像和文本分类的项目中,越来越多地用到了CNN。
基于传统CNN的数据分类方法,依赖于有标签数据的训练,由于生活中采集的数据多数是无标签的数据,使得在训练算法模型的过程中,大量的时间花费在标记数据上。同时,传统的CNN的网络结构对于与训练集中数据分布一致的数据能够很好分类,当测试集中出现与训练集中的数据分布不一致的数据,测试集的准确率会大幅下降。因此,传统的CNN神经网络结构的泛化性过低,使得CNN网络对于不同于训练集数据分布的测试集数据识别准确率较低,限制了深度学习模型的使用场景。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何使得训练的深度学习模型能提高目标域(测试集数据)的准确率。
(二)技术方案
为了解决上述技术问题,本发明提供了一种基于表示学习和迁移学习的领域适配方法,包括以下步骤:
步骤一、针对源域和目标域的数据,通过CNN模型的卷积池化提取源域特征和目标域特征;其中源域的数据是训练集中的传感器的数据,目标域的数据是测试集中传感器的数据;
步骤二、针对源域特征和源域真实标签,通过Center Loss与Softmax Loss联合损失函数获得可分离的源域特征;
步骤三、通过MMD Loss拉近经步骤二处理后的源域特征,与目标域特征分布的距离。
优选地,步骤一中,采用深度学习网络CNN中的卷积层和池化层分别提取源域的数据特征和目标域的数据特征。
优选地,步骤一中,源域的数据通过卷积的操作提取特征,每层卷积层包括50个卷积核,每个卷积核大小是5*1,然后对数据进行池化操作,池化层是进行最大池化的操作,池化选用3*1的最大池化,池化操作后得出的是源域的数据特征;目标域的数据通过卷积的操作提取特征,每层卷积层包括50个卷积核,每个卷积核大小是5*1,然后对数据进行池化操作,池化层是进行最大池化的操作,池化选用3*1的最大池化,池化操作后得出的是目标域的数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911084862.6/2.html,转载请声明来源钻瓜专利网。





