[发明专利]基于文本和用户表示学习的文本立场检测方法有效
申请号: | 202110233476.X | 申请日: | 2021-03-03 |
公开(公告)号: | CN112949318B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 彭愈翔;罗绪成 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 用户 表示 学习 立场 检测 方法 | ||
1.一种基于文本和用户表示学习的文本立场检测方法,其特征在于,包括以下步骤:
S1:确定需要进行文本立场检测的社交媒体平台,从该社交媒体平台上收集需要进行文本立场检测的话题的文本数据集,文本数据集包括若干与该话题相关的文本,以及发布这些文本的用户之间的关注列表与被关注列表;
根据用户之间的关注列表与被关注列表,生成一个有向无环的用户社交关系图G=V,E,其中V表示所有用户ID集合,E表示用户之间有向边的集合,如果用户i关注了用户j,则存在一条从用户i到用户j的有向边,i,j∈V;然后根据构建用户社交关系图G=V,E的邻接矩阵A和度矩阵D;对邻接矩阵A与度矩阵D进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw;
将用户在文本中的立场规范为反对、中立、赞成三个取值,并以one-hot的形式编码得到3维立场向量,根据每个文本的立场确定其对应的立场向量作为立场标签向量;
S2:将文本数据集中的文本统一为预设长度W:如果文本长度大于W,则删除超出部分文本,如果文本长度小于W,则填充预设字符;将处理得到的各个文本分别输入预训练的BERT模型,将其输出的d维向量作为文本向量vt,其中t表示文本,t∈Φ,Φ表示文本数据集中文本集合,d的大小根据实际需要设置;
S3:构建立场检测模型,包括GCN网络、交互层、决策层、全连接层,其中:
GCN网络用于生成用户向量,具体方法为:将用户社交关系图的拉普拉斯矩阵作为GCN网络的邻接矩阵,GCN网络对用户初始向量矩阵进行处理,得到的输出矩阵作为用户向量矩阵,每行向量作为对应用户的用户向量;
交互层用于将文本向量和GCN网络得到的文本所属用户的用户向量进行语义融合得到交互向量;交互层包括隐藏层和attention层,其中隐藏层用于对文本向量和用户向量求外积得到d×d的交互矩阵;attention层用于对交互矩阵进行降维得到d维交互向量;
决策层用于对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量;决策层包括拼接层、MLP网络、softmax层和加权合成模块,其中拼接层用于将用户向量、文本向量和交互向量进行拼接,得到3×d的拼接矩阵;MLP网络用于获取拼接矩阵中每个行向量的隐含表示向量uj,j=1,2,3;softmax层用于根据3个隐含表示向量uj确定归一化的权重αj,其计算公式如下:
其中,uw为d维向量,用于将隐含表示uj降维为一个数值;
加权合成模块用于根据权重αj对用户向量、文本向量以及交互向量进行加权求和,得到加权合成向量s,加权求和公式如下:
s=∑αjhj
其中,h1,h2,h3分别表示用户向量、文本向量以及交互向量;
全连接层用于对加权合成向量s进行处理得到3维向量,其中每个元素表示文本属于反对、中立、赞成三种立场的概率;
S4:将步骤S1中的拉普拉斯矩阵Lrw作为立场检测模型中GCN网络的邻接矩阵,随机生成文本数据集中每个用户的d维初始向量并作为行向量构成用户初始向量矩阵U,将用户初始向量矩阵U和步骤S2得到的文本向量作为输入,文本向量所对应的立场标签向量作为期望输出,对立场检测模型进行训练;
S5:当需要对社交媒体平台用户所发布的文本进行立场检测时,首先获取社交媒体平台当前用户之间的关注列表与被关注列表,生成有向无环的用户社交关系图G′,构建邻接矩阵A′和度矩阵D′并采用步骤S1相同方法进行拉普拉斯矩阵变换得到拉普拉斯矩阵Lrw′;将所需进行立场检测的文本采用步骤S2中的相同方法得到d维的文本向量v′;
将拉普拉斯矩阵Lrw′作为立场检测模型中GCN网络的邻接矩阵,随机生成用户社交关系图G′中各个用户的d维初始向量并作为行向量构成用户初始向量矩阵U′,将用户初始向量矩阵U′和文本向量v′输入立场检测模型,得到立场检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233476.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机床过载监控系统以及控制方法
- 下一篇:一种雨天音量自调式园林音响