[发明专利]基于神经网络生成大规模情感词典的方法在审
| 申请号: | 201810297088.6 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN108519976A | 公开(公告)日: | 2018-09-11 |
| 发明(设计)人: | 王黎明;李永帅;柴玉梅;张卓;韩慧;徐源音;韩飞 | 申请(专利权)人: | 郑州大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/08 |
| 代理公司: | 河南大象律师事务所 41129 | 代理人: | 王克鹏;田永红 |
| 地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及基于神经网络生成大规模情感词典的方法,包括以下步骤:通过爬虫爬取数据并处理后生成数据词典D;通过改进的连续词袋方法进行训练情感词向量,得到同时具有句法结构信息和情感信息的词表示;对情感词向量进行正规化;利用正规化后的情感词向量进行双向长短期记忆神经网络训练;采用损失函数交叉熵作为目标函数;经过训练出来的双向LSTM神经网络分类器,进一步利用测试数据获得大规模情感词典。本发明利用改进的连续型词袋方法训练出一套具有高质量的情感词的向量表示,并通过长短期记忆神经网络不仅考虑到句法结构信息还包含了语义信息,从而获取更高的情感词获取质量以及增大了情感词的数量。 | ||
| 搜索关键词: | 情感词 情感词典 向量 记忆神经网络 句法结构 神经网络 正规化 神经网络分类器 测试数据 目标函数 情感信息 生成数据 损失函数 向量表示 语义信息 爬虫 交叉熵 连续型 改进 | ||
【主权项】:
1.基于神经网络生成大规模情感词典的方法,其特征在于,包括以下步骤:步骤1,通过爬虫爬取数据并处理后生成相应的数据词典D;步骤2,通过连续词袋方法进行训练情感词向量,输入层是预测词wt的2m个上下文词wt‑m wt‑(m‑1) ..... wt+m,那么经过Vn×|V|矩阵转换,由one‑hot转化为Word Embedding进一步描述,转化后的词向量vi=Vwi,i∈{t‑m,....,t+m},作为整个网络的输入的一部分
其中m=2;步骤3,输入情感信息方法假设情感语句sj中词语的数量为C,那么
在知道一个情感极性句子的情况下,作为整个网络的输入;步骤4,约束句法结构信息和情感信息,并得到同时具有句法结构信息和情感信息的词表示;步骤5,在情感词典扩展前对情感词向量表示进行正规化;步骤6,利用种子情感微博进行双向长短期记忆神经网络训练,并采用损失函数交叉熵作为目标函数;步骤7,经过训练出来的双向LSTM神经网络分类器,利用测试数据获得情感词典。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810297088.6/,转载请声明来源钻瓜专利网。
- 上一篇:英语作文语法错误自动检测与分析方法
- 下一篇:一种信息处理方法及电子设备





