[发明专利]基于神经网络生成大规模情感词典的方法在审

申请号：	201810297088.6	申请日：	2018-04-04
公开（公告）号：	CN108519976A	公开（公告）日：	2018-09-11
发明（设计）人：	王黎明;李永帅;柴玉梅;张卓;韩慧;徐源音;韩飞	申请（专利权）人：	郑州大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/30;G06N3/08
代理公司：	河南大象律师事务所 41129	代理人：	王克鹏;田永红
地址：	450000 河南省郑州***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及基于神经网络生成大规模情感词典的方法，包括以下步骤：通过爬虫爬取数据并处理后生成数据词典D；通过改进的连续词袋方法进行训练情感词向量，得到同时具有句法结构信息和情感信息的词表示；对情感词向量进行正规化；利用正规化后的情感词向量进行双向长短期记忆神经网络训练；采用损失函数交叉熵作为目标函数；经过训练出来的双向LSTM神经网络分类器，进一步利用测试数据获得大规模情感词典。本发明利用改进的连续型词袋方法训练出一套具有高质量的情感词的向量表示，并通过长短期记忆神经网络不仅考虑到句法结构信息还包含了语义信息，从而获取更高的情感词获取质量以及增大了情感词的数量。
搜索关键词：	情感词情感词典向量记忆神经网络句法结构神经网络正规化神经网络分类器测试数据目标函数情感信息生成数据损失函数向量表示语义信息爬虫交叉熵连续型改进
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于神经网络生成大规模情感词典的方法，其特征在于，包括以下步骤：步骤1，通过爬虫爬取数据并处理后生成相应的数据词典D；步骤2，通过连续词袋方法进行训练情感词向量，输入层是预测词w_t的2m个上下文词w_t‑m w_t‑(m‑1) ..... w_t+m，那么经过V_n×|V|矩阵转换，由one‑hot转化为Word Embedding进一步描述，转化后的词向量v_i＝Vw_i,i∈{t‑m,....,t+m}，作为整个网络的输入的一部分其中m＝2；步骤3，输入情感信息方法假设情感语句s_j中词语的数量为C，那么在知道一个情感极性句子的情况下，作为整个网络的输入；步骤4，约束句法结构信息和情感信息，并得到同时具有句法结构信息和情感信息的词表示；步骤5，在情感词典扩展前对情感词向量表示进行正规化；步骤6，利用种子情感微博进行双向长短期记忆神经网络训练，并采用损失函数交叉熵作为目标函数；步骤7，经过训练出来的双向LSTM神经网络分类器，利用测试数据获得情感词典。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于郑州大学，未经郑州大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810297088.6/，转载请声明来源钻瓜专利网。

上一篇：英语作文语法错误自动检测与分析方法
下一篇：一种信息处理方法及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于神经网络生成大规模情感词典的方法在审

专利文献下载