[发明专利]一种基于CNN-GRNN的读者情绪分布预测算法有效
申请号: | 201710792420.1 | 申请日: | 2017-09-05 |
公开(公告)号: | CN107608956B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 彭志平;张琦;崔得龙;李启锐;何杰光 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G06F16/35;G06N3/08 |
代理公司: | 广州润禾知识产权代理事务所(普通合伙) 44446 | 代理人: | 郑永泉 |
地址: | 525000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cnn grnn 读者 情绪 分布 预测 算法 | ||
本发明涉及一种基于CNN‑GRNN(Convolutional Neural Network‑General Regression Neural Network)的读者情绪分布预测算法,与读者情绪有关的语义特征可以分配更大的注意力概率权重,突出了与读者情绪有关的语义特征的作用,减少了其他非相关特征的干扰,因此本算法又可称为CNN‑GRNN‑CBAT,其中CBAT表示Context Based Attention。
技术领域
本发明涉及文本情感分析领域,具体涉及一种基于CNN-GRNN的读者情绪分布预测算法。
背景技术
随着信息技术的不断发展和Web2.0的到来,人们习惯于借助在线新闻网站、论坛和微博等新一代网络媒体表达自己的观点和态度,互联网成为了人们交流观点、抒发情感的平台,网络中积累了海量的能够反映人们情绪和行为的文本信息,因此,文本情感分析技术应运而生并成为自然语言处理和计算语言学的研究热点。目前情感分析的工作大多集中于文本直接呈现的情感极性的研究,这些研究主要采用单标签的方式将文本分为正面态度和负面态度,包括热门的微博情感倾向性分析,以及在线评论网站中用户评论文本的情感分类等,而针对文本所可能引发的读者情绪的研究较少。
读者情绪分析旨在研究语言文字激发人们产生喜、怒、哀、乐等情绪的机制,并预测读者阅读文本后可能产生的情绪。读者情绪研究一方面可用于舆情监控的早期预警。传统舆情监控系统大多是基于热点分析,通过对热点话题进行跟踪来实现舆情的预警,但是热点表明事件已经造成足够大的影响,舆情监控的延时和代价较大,而情绪预测的方法能够更快地预测到可能导致读者负面情绪的文本,及时采取相应的跟踪措施,从而尽早控制和解决问题。另一方面可预测人们阅读文本后的情绪信息,辅助网络媒体提供商更好地了解用户的偏好,为用户提供个性化的推荐服务。因此读者情绪分析具有重要的研究价值和现实意义。但由于人类的情绪十分复杂,读者情绪预测的研究相对困难,目前仍处于起步阶段,研究成果较少。Bhowmick等人考虑读者产生的几种主要情绪,使用RAkEL算法将文本划分到多个情绪类别。Xu等人利用LDA主题模型把文本映射到隐含的主题特征空间,从而将读者情绪与文本的隐含主题相关联,提高了多标签情绪分类的准确度。温雯等人进一步提出基于多类别语义词簇的方法,将词语表示成词向量的形式,并针对标签对其进行聚类形成多个语义词簇,影响读者情绪的文本特征可以通过不同语义词簇的频率来表示,最后采用MLKNN进行多标签分类。
现有的研究方法主要是将读者情绪预测转换成多标签文本分类问题,认为分类后文本所属的情绪标签即是读者可能产生的情绪,忽略了文本的语序和语法信息,而且难以捕捉复杂的语言现象和人类多种情绪之间的复杂性。
发明内容
为了克服现有技术的缺陷,本专利提供一种基于CNN-GRNN(ConvolutionalNeural Network-General Regression Neural Network)的读者情绪分布预测算法,能够通过分配句子的注意力概率权重来准确捕捉读者可能产生的情绪。
针对上述技术问题,本专利是这样加以解决的:一种基于CNN-GRNN的读者情绪分布预测算法,其步骤如下所示:
S1、将文本的多个句子合并为一个数据集,通过每个句子对应的矩阵计算句子特征向量;
S2、序列层:按上下文顺序从上到下依次对每个句子的句子特征向量进行迭代,每迭代一次就得到一个隐含层向量,并计算每个隐含层向量的注意力概率权重,将每个隐含层向量和相对应的注意力概率权重相乘后累加得到语义编码,再结合语义编码和最后迭代得到的隐含层向量进行聚合运算得到文本特征向量;
S3、设文本情绪标签数目为k,将文本特征向量转换成长度等于k的向量,通过回归模型得到文本的情绪标签分布
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710792420.1/2.html,转载请声明来源钻瓜专利网。