[发明专利]一种用于微博评论的事件相关观点句分类方法有效
申请号: | 202110448958.7 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113076425B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 相艳;施敬磊;余正涛;线岩团;郭军军;黄于欣 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F16/9536;G06N3/04 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 评论 事件 相关 观点 分类 方法 | ||
1.一种用于微博评论的事件相关观点句分类方法,其特征在于:所述方法包括如下:
Step1、获取微博评论嵌入Er、微博标题嵌入Et、情感词嵌入Es;
Step2、把微博评论嵌入Er、情感词嵌入Es进行拼接,拼接后得到的结果E通过自注意机制转换到一个新的嵌入E′,然后这个新的嵌入E′通过自注意机制被送入三个不同大小的卷积层,每个卷积结果都经过最大池化,然后把最大池化后的结果进行拼接,得到Rs,它表示句子是否有观点;
Step3、分别对微博评论嵌入Er、微博标题嵌入Et进行卷积运算,分别得到微博评论的特征映射R和微博标题的特征映射T;T经过最大池化得到向量t,用来计算与R的相互注意力,得到相互注意力权重γ;然后通过相互注意力权重γ将R更新为更关注与标题相关的特征向量R′;再对特征向量R′进行最大池化操作,得到Rt,它表示句子是否与微博标题相关;
Step4、将Step2最终得到的结果Rs和Step3最终得到的结果Rt进行拼接作为句子向量Ro,基于这个句子向量Ro进行预测;
所述Step2中,拼接后得到的结果E通过自注意机制转换到一个新的嵌入E′的具体方式如下:
对嵌入层中的E进行自我注意操作,对于E的第i个嵌入向量Ei,用如下公式计算其注意权值:
Ei′=αiEi
通过这个操作,将原来的E转化为E′,利用带有自我注意的卷积运算进行特征提取;使用宽度为h1的ns卷积滤波器来获得ns特征,ns特征构成第i个单词的特征向量Ci,然后对Ci进行自我注意操作:
Ci′=βiCi
其中,为待优化的参数;该自我注意力操作的目的是对不同滤波器提取的特征映射赋予不同的权重;然后,对特征映射应用最大池化操作,取最大值作为滤波器对应的特征;宽度为h1的不同滤波器的最大值被连接起来作为增强的表示形式对于宽度h2和h3的另外两个卷积操作,使用相同的注意机制来得到and将它们连接起来,以得到增强的意见表示Rs即也表示句子是否有观点;
所述Step3中,用于产生微博评论嵌入Er和微博标题嵌入Et的新特征,对Er和Et分别进行卷积运算,将滤波器w应用于Er和Et产生新特征:微博评论的特征映射和微博标题的特征映射对特征映射T进行最大池操作,得到t,用t得到每个特征向量Ri,i=1,2,…,n在R中的相互注意力权重为γ,公式如下:
Ri′=γiRi
其中为待优化参数,通过相互注意操作,将R更新为更关注标题的特征向量R′;然后对特征向量R′应用最大池化操作,得到内容相关性的表示Rt即也表示句子是否与微博标题相关。
2.根据权利要求1所述的用于微博评论的事件相关观点句分类方法,其特征在于:所述Step1中,如果微博评论的单词出现在情感字典中,将随机值赋给微博评论的单词作为它的情感词嵌入Es;否则,它的情感嵌入和评论嵌入是一样的;
所述微博评论嵌入Er和微博标题嵌入Et则这样求出:设表示评论x中第i个单词的d维词向量,则评论嵌入为其中为拼接运算符,n为评论长度;设表示标题z中第i个单词的d维词向量,则微博标题嵌入
3.根据权利要求1所述的用于微博评论的事件相关观点句分类方法,其特征在于:所述Step4中,拼接后的句子向量通过非线性变换将其投影到两个类别的空间中,得到评论属于类别的概率,将概率最高的类别设置为最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448958.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机高楼清洁装置
- 下一篇:基于答案类别和句法指导的案情阅读理解方法