[发明专利]一种基于领域对抗自适应的跨领域文本情感分类方法有效
申请号: | 201811263266.X | 申请日: | 2018-10-28 |
公开(公告)号: | CN109492099B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 贾熹滨;曾檬;史佳帅;刘洋;苏醒;郭黎敏 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于领域对抗自适应的跨领域文本情感分类方法,该方法包括:输入源领域和目标领域样本的词向量矩阵、类别标签和领域标签;利用基于卷积神经网络的特征提取模块,提取样本的低层特征;在主任务模块构建基于源领域和目标领域分布一致性的约束,将低层样本映射到再生核希尔伯特空间,学习具有可转移性的高层特征;将源领域的高层特征输入类别分类器,在减小领域差异的基础上,保证分类器对样本具备类别判别性;在辅助任务模块构建基于对抗学习的领域不变性约束,将低层特征输入具有对抗性质的领域分类器,令分类器尽可能无法判别样本所属领域,从而提取具有领域不变性的高层特征,有效解决了源领域分类器到目标领域的迁移问题。 | ||
搜索关键词: | 一种 基于 领域 对抗 自适应 文本 情感 分类 方法 | ||
【主权项】:
1.一种基于领域对抗自适应的跨领域文本情感分类方法,其特征在于:该方法包括以下步骤:步骤1,输入源领域和目标领域样本的词向量矩阵、情感类别标签和领域标签;步骤2,利用基于CNN的特征提取模块,提取源领域和目标领域样本的低层特征;步骤3,构建主任务模块,提取具有可转移性、对标签具有判别性的高层特征;步骤3.1,通过高斯核函数将低层特征映射到RKHS,在该空间中利用MMD度量源领域和目标领域样本的距离;步骤3.2,将源领域高层特征作为训练数据输入类别分类器;步骤4,构建辅助任务模块,将低层特征作为训练数据输入具有对抗性质的领域分类器,提取具有领域不变性的高层特征。步骤5,将目标领域样本输入已训练好的模型,输出文本数据情感类别的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811263266.X/,转载请声明来源钻瓜专利网。