[发明专利]基于多模态特征和情感词典的文本抑郁倾向检测系统有效
申请号: | 202110583446.1 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113361252B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王红;张慧;庄鲁贺;韩书;李威;杨杰;王正军;杨雪;滑美芳 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/211;G06F40/216;G06F40/242;G06F40/284;G06F40/30;G06F16/35;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 祖之强 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 特征 情感 词典 文本 抑郁 倾向 检测 系统 | ||
本公开提供了一种基于多模态特征和情感词典的文本抑郁倾向检测系统,其工作方法为:对获取的文本数据进行预处理;根据预处理后的文本数据和预设词嵌入模型,得到词嵌入向量;根据预处理后的文本数据和预设情感词典,得到每个词的二维情感特征向量;提取文本数据中的词性特征向量,依次与二维情感特征向量和词嵌入向量拼接后,得到单词级别的特征向量表示;提取文本数据中的词频特征向量,得到句子级别的特征向量表示;根据单词级别的特征向量表示、句子级别的特征向量表示以及预设CNN‑BiLSTM网络模型,得到最终的分类结果;本公开根据社交媒体文本数据,扩充了现有的情感词典,实现了更精准的文本抑郁倾向检测。
技术领域
本公开涉及文本数据处理技术领域,特别涉及一种基于多模态特征和情感词典的文本抑郁倾向检测系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。
抑郁症是一种严重的精神疾病,随着社交媒体的迅速发展,患有精神疾病的用户会在社交平台上发布一些帖子,以在线寻求帮助和支持,这使得庞大的数据可供研究人员进行分析。
发明人发现,在文本抑郁倾向检测技术方面,传统的机器学习分类算法在特征工程中需要消耗大量的人力物力;并且,针对社交媒体帖子而言,由于其书写的随意性、并过多得使用网络词语,现有的研究大多缺乏对文本中词的情感信息的特征提取,特别是忽视了网络流行词汇和表情符号等所传达的情感信息,因此采用传统的特征提取方式反而效果不好,模型分类精度不高。
发明内容
为了解决现有技术的不足,本公开提供了一种基于多模态特征和情感词典的文本抑郁倾向检测系统,根据社交媒体文本数据,扩充了现有的情感词典,提取了二维情感特征向量、单词级别的特征向量表示和句子级别的特征向量表示,实现了更精准的文本抑郁倾向检测。
为了实现上述目的,本公开采用如下技术方案:
本公开第一方面提供了一种基于多模态特征和情感词典的文本抑郁倾向检测系统。
一种基于多模态特征和情感词典的文本抑郁倾向检测系统,包括:
数据获取模块,被配置为:获取待处理的文本数据,对获取的文本数据进行预处理;
词嵌入模块,被配置为:根据预处理后的文本数据和预设词嵌入模型,得到词嵌入向量;
情感特征向量获取模块,被配置为:根据预处理后的文本数据和预设情感词典,得到每个词的二维情感特征向量;
单词级特征向量获取模块,被配置为:提取文本数据中的词性特征向量,依次与二维情感特征向量和词嵌入向量拼接后,得到单词级别的特征向量表示;
句子级特征向量获取模块,被配置为:提取文本数据中的词频特征向量,得到句子级别的特征向量表示;
分类模块,被配置为:根据单词级别的特征向量表示、句子级别的特征向量表示以及预设CNN-BiLSTM网络模型,得到最终的分类结果。
进一步的,分类模块中,将单词级别的特征向量表示和句子级别的特征向量表示,分别输入到预设卷积神经网络中,将两个卷积神经网络输出的高层特征进行融合后输入到预设Bi-LSTM网络模型中,得到分类结果。
进一步的,对获取的文本数据进行预处理,包括:
从文本数据中提取标题、内容和标签,去除由于已删除内容而缺少的数据以及不相关数据,将文本数据转换为小写字母。
进一步的,对SenticNet4.0情感词典进行扩充,包括:融入常用的网络表情符号、常用网络流行用语的情感以及常用俚语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110583446.1/2.html,转载请声明来源钻瓜专利网。