[发明专利]基于多源领域实例迁移的情感分类方法有效

专利信息
申请号: 201410032866.0 申请日: 2014-01-23
公开(公告)号: CN103761311B 公开(公告)日: 2016-11-02
发明(设计)人: 张倩;李海港;张勇 申请(专利权)人: 中国矿业大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 淮安市科翔专利商标事务所 32110 代理人: 韩晓斌
地址: 221008 江苏省徐州市解放南路*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 领域 实例 迁移 情感 分类 方法
【权利要求书】:

1.一种基于多源领域实例迁移的情感分类方法,其特征是,包括以下步骤:

步骤1),引入多源学习,通过从不同的源领域中迁移样本或是结合多个源领域的特点,使得迁移学习更加稳定且有效,给目标样本分配较多的初始权重,缓解权重不匹配的问题,并且在每一步对数据进行重新采样改善引用不平衡的现象;

    步骤1.1),初始化权矢量                                                ,其中为第个源领域训练样本的权重矢量,为目标领域训练样本的权重矢量;

步骤1.2),从第一次迭代开始,计算源领域训练样本总权重,设,其中为全部源领域训练样本个数,为第个源领域训练集包含样本数量;

步骤1.3),清空候选弱分类器集合,将权矢量归一化;

步骤2),调用基分类器在每一个训练集训练得到一个弱分类器,将所有弱分类器组成弱分类器集,分别计算每个弱分类器在目标训练集上的误差,根据测试误差对每个弱分类器加相应的权重,由于正确率高的分类器对应的源领域包含对目标任务有用的信息多,对目标任务的学习帮助大,所以误差大的分类器设置权重小,误差小的分类器设置权重大;

步骤2.1),调用基分类器在每一个源训练集训练得到一个弱分类器;

步骤2.2),计算弱分类器在目标领域上的误差,其计算公式为,其中,表示候选若分类器分类错误,表示对N个源领域求和;

步骤2.3),根据弱分类器在目标领域上的误差大小更新弱分类器的权重,其计算公式为,循环往复,直到历遍N个源领域;

步骤3),将加权后的弱分类器集成得到当前第t次迭代的候选分类器,然后计算候选分类器在目标训练集和不同源领域训练集上的误差,并加入动态因子,更新源领域样本的权重,对于分类正确的源领域样本权重不变,分类错误的源样本权重减小,减小分类错误样本的权重表示此样本对目标任务的学习没有帮助,降低此样本对目标学习的影响;

步骤3.1),得到第次迭代的候选分类器,其计算公式为;

步骤3.2),计算候选分类器在目标领域上的误差率,其计算公式为;

步骤3.3),计算分类器的权重,其计算公式为,其中的大小为,越小,则目标分类误差越小,表明与目标领域的相关度越高,将多次迭代的基分类器组合成目标分类器,源领域中的有用知识就会逐渐迁移到目标领域中;

步骤3.4),计算出动态因子的值,其计算公式为;

步骤3.5),更新源样本权矢量和目标样本权矢量;

步骤4),经迭代达到最大次数M次后输出最终强分类器,如果没有达到最大迭代次数则重新从矢量归一化开始。

2.根据权利要求1所述一种基于多源领域实例迁移的情感分类方法,其特征是,本发明中源样本权矢量的更新使用加权多数算法WMA,通过迭代降低错误分类源样本的权重来调整源数据集的权重,并保存正确分类源样本的当前权重值。

3.根据权利要求1所述一种基于多源领域实例迁移的情感分类方法,其特征是,所述步骤3.3)中为了满足,的值必须小于0.5,但是为了避免算法停止,当其值超过0.5时,设置。

4.根据权利要求1所述一种基于多源领域实例迁移的情感分类方法,其特征是,所述步骤3.4)中动态因子的计算公式的推导方法为:首先令是第步迭代正确分类目标权重的总和,是第步迭代错误分类目标权重的总和,其表达式如下:

    则算法源权重的值更新为:

    在每个WMA迭代中引入动态因子,由于有等式,有公式:

  

    进而可以计算出动态因子的值:

5.根据权利要求1所述一种基于多源领域实例迁移的情感分类方法,其特征是,所述步骤3.5)中更新源样本权矢量的计算方法为,其中,源样本权重更新的收敛率由和动态因子计算得到,对于分类正确的源领域样本权重不变,分类错误的样本权重减小,减小分类错误样本的权重表示此样本对目标任务的学习没有帮助,降低此样本对目标学习的影响;更新目标样本权矢量的计算方法为,其中,目标样本的权重更新利用的值计算,只需要知道目标误差率的值即可,在每个迁移学习模型中,源样本分布都是相关的,目标样本可以从合并的相关源样本中获得知识。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410032866.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top