[发明专利]一种基于判别联合概率的域适配方法及系统在审
申请号: | 202010515089.0 | 申请日: | 2020-06-08 |
公开(公告)号: | CN111626376A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 杨杨;陶卓;石晓丹;刘祖龙;张艺馨;赵倩;王健鑫;葛忠迪;严雨;张振威 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈新生 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 判别 联合 概率 配方 系统 | ||
本发明实施例提供的基于判别联合概率的域适配方法及系统,包括获取历史流量数据集;根据历史流量数据集,构建带标签的源域数据集和带标签的目标域数据集;根据带标签的源域数据集和带标签的目标域数据集,计算源域和目标域之间的联合概率差异;根据联合概率差异获取最小化联合概率差异;基于最小化联合概率差异,将带标签的源域数据集向带标签的目标域数据集进行域适配。本发明实施例提供的域适配方法及系统,通过直接计算最小化联合概率差异,度量边际分布和条件分布的差异,构造了对实质分布差异有效且鲁棒的特征表示,提高了域的可转移性和类的可识别性。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种基于判别联合概率的域适配方法及系统。
背景技术
近年来,随着跨领域知识之间适应问题的出现,开发迁移学习算法引起了越来越多的研究兴趣。在现实应用中,能够获取的源域与目标域往往存在较大的差异。因此,如何有效的利用有标注的源域数据集并迁移到相关的无标注的目标域,受到极大的关注和发展。迁移学习在图像分类和标记、目标识别和特征学习等方面都有很好的应用前景。迁移学习不要求源域数据与目标域数据服从同一分布,能通过共享子空间或者共享特征把从源域学习到的信息迁移转换到目标域中,以解决目标域带标签样本数据量少的分类问题。
数据集偏移是机器学习领域中一个不容忽视的问题。数据集是描述现实世界物体的片面化表述,在描述同一个物体集合的数据集上训练相同结构的模型,泛化能力往往存在偏差。域适配被尝试着用于解决数据集偏移问题,以基于源领域和目标领域间的相似性及差异性,提高模型在目标领域数据上的表现。域适配是迁移学习的一类方法,该方法不再要求训练数据与测试数据分布相同,可以利用相关领域的大量数据辅助目标域任务进行分类学习,能有效的解决源域与目标数据分布不同的分类学习问题。因此,随着迁移学习的发展,许多学者开始研究域适配问题。
其一,现有技术1提供了一种基于深度网络和对抗技术的领域适配方法,其中涉及到深度学习,迁移学习,领域适配,卷积神经网络以及对抗网络等技术。该方法在微调Alexnet的基础上,增加两个对抗子网,用于对抗式的修正不同领域样本间的差异,以在high-level层学习到可共享特征。最终训练好的网络可以有效的替代人工标记过程,从而获得更多,更准确的有标记样本。
现有技术1的方案是通过在微调Alexnet的基础上,增加两个对抗子网,用于对抗式的修正不同领域样本间的差异,在high-level层学习到可共享特征。该算法在新的目标风险误差上界基础上做出了创新,算法流程主要包括初始化阶段和网络训练阶段。在初始化阶段,根据新的误差上界和构建新的神经元层,同时增加相应的损失和正则化项,并对网络和数据集进行初始化工作;在训练阶段,通过概率闭值取代原有超参数,根据概率迭代的SGD算法运行若干个迭代周期,直至满足条件,训练结束。该方法虽然能够对域进行适配,但是神经网络的迭代次数过多,导致耗时较长。
其二,现有技术2提供了一种基于表示学习和迁移学习的领域适配方法,该方法基于源域的少量真实标签实现,从而减少对有标签数据的依赖。通过Center Loss与SoftmaxLoss联合损失函数能够使得源域的数据特征扩大类间距,缩小类内距,从而获得源域的可分离的特征。通过定义源域特征和目标域特征之间的距离的损失函数即MMD Loss损失函数,能够再通过神经网络的训练过程降低MMD Loss损失函数的值,从而拉近源域和目标域的距离,最终提高目标域的准确率。
现有技术2的方案,首先针对源域和目标域的数据,通过CNN模型的卷积池化提取特征;然后,借助于Ceter loss与SoftWare Loss联合损失函数获得可分离的源域特征;最后,通过MMD Loss拉近源域特征,即与目标域特征分布的距离。该方法虽然能够提高目标域的准确率,但是不能够很好地提高不同域之间的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010515089.0/2.html,转载请声明来源钻瓜专利网。