[发明专利]一种基于用户知识的个性化隐式情感分析方法与系统在审
申请号: | 202210003724.6 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114281999A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 廖健;王素格;郑建兴 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06N5/02;G06F40/30 |
代理公司: | 山西科汇联创知识产权代理事务所(特殊普通合伙) 14126 | 代理人: | 胡新瑞 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 知识 个性化 情感 分析 方法 系统 | ||
1.一种基于用户知识的个性化隐式情感分析方法,其特征在于:包括以下步骤:
S1:使用开放领域文本及交互数据,构建用户外部信息和用户内部信息库;
其中,所述的用户外部信息包括用户的社会化关注关系,通过矩阵A进行表示;所述的用户内部信息库包括用户id、用户发布内容集合C以及用户基本信息集合I;待分析隐式情感句标记为s;
S2:将用户基本信息集合I输入Bert预训练模型获取其向量表示,将向量拼接获取用户基本信息I的特征表示Ei;
S3:使用开放情感常识知识库,利用句子-词汇的匹配关系构建知识图谱G;
S4:根据基于知识嵌入的多极性注意力模型结合步骤S3中所述的知识图谱G,获取步骤S1中所述的用户发布内容集合C的特征表示为Ec,以及待分析隐式情感句子序列特征表示为Hs;
S5:根据UD-GCN模型,以步骤S1中获取的矩阵A为输入获取用户社会化关系特征表示为Eu;
S6:根据堆栈注意力模型,将步骤S2、S4、S5中获取的用户基本信息集合I的特征Ei、用户发布内容集合C的特征Ec、用户社会化关系特征Eu与隐式情感句子序列特征Hs进行融合学习,获取用户知识嵌入的隐式情感句子语义表示H;
S7:根据正交注意力机制模型,对步骤S6中获取的用户知识嵌入的隐式情感句子语义表示H进行优化训练,通过全连接层预测该句子的隐式情感标签
2.根据权利要求1所述的一种基于用户知识的个性化隐式情感分析方法,其特征在于:步骤S1中构建的用户社会化关注关系矩阵n为输入数据集包含的用户个数,Aij∈{0,1,2,3}表示用户i与用户j之间的社会化关注关系,包括i关注j、j关注i、ij互相关注以及无关系四种类型,用户的基本信息集合I包括用户性别、地域以及个人签名信息。
3.根据权利要求1所述的一种基于用户知识的个性化隐式情感分析方法,其特征在于:步骤S3中所述开放情感常识知识库的知识以三元组形式呈现,形式为T=h,r,t,其中,h为头实体,r为实体间的关系,t为尾实体。开放情感词典库记为d,需要进行知识匹配的句子记为S,步骤S3中所述句子-词汇匹配关系定义包括如下四种:
(1)情感常识三元组筛选:主要用于获取带情感信息的三元组,使用三元组与情感词匹配,确保三元组中的h或t包含情感词,即h∈d或t∈d,且h和t不会同时包含词典d中的词;
(2)文本相关三元组筛选:主要用于获取与文本相关的三元组,使用隐式情感数据与筛选后的数据匹配,仅当三元组中的h或t存在于句子S中时,即h∈S或t∈S,且h和t不会同时存在于S中,保留此三元组;
(3)关系类型筛选:主要用于获取合适关系类型的三元组,通过人工对一定关系下的三元组的合理性进行判别,即判别h、t和r之间是否出现逻辑问题,选取前十种匹配得到的最多三元组的关系类型,作为要引入的三元组;
(4)语义相关三元组筛选:主要用于获取与隐式情感句语义相关的三元组,把三元组转化为一个句子表达以计算其与句子的语义相似度,使用Bert模型学习自然语言形式的三元组表达和隐式情感句的表示,并进行余弦相似度计算,所述余弦相似度计算公式为:
其中,E1和E2表示三元组转化的句子与隐式情感句子分别输入Bert模型学习得到的向量,
对筛选出的三元组计算余弦值并降序排列,选取相似度值前七的三元组引入文本中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210003724.6/1.html,转载请声明来源钻瓜专利网。