[发明专利]一种情感分析的装置和方法在审
| 申请号: | 202111202789.5 | 申请日: | 2021-10-15 |
| 公开(公告)号: | CN113849610A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 曾祥云;朱姬渊 | 申请(专利权)人: | 上海大参林医疗健康科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 王法男 |
| 地址: | 201306 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 情感 分析 装置 方法 | ||
本发明公开一种情感分析的装置和方法,其中的一种情感分析的装置包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;实体抽取网络模块用以根据实体识别特征集抽取实体词;情感提取网络模块用以根据句子特征向量集得到情感词特征向量;特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征,此特征加强了实体和情感词的权重,能有效提升模型整体的实体识别和情感分类的准确率。在实际应用中,采用本发明所述的模型和方法能明显提高识别的准确率,具有较好的推广意义。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种情感分析的装置和方法。
背景技术
随着网络技术的发展,越来越多的产品通过互联网进行销售,电商平台以及品牌方需要持续关注用户的评价,通过分析评价数据,抽取评价词的正负面,对产品和服务的反馈舆情进行挖掘,统计情感走势,以此为依据进一步对产品和服务进行改进。
目前现有的技术通常是采用两个模型,一个模型用于抽取产品名称,如药品、水杯,一个模型用于分析评价词的情感类型,在实际应用中,采用两个模型,存在重复建设、效率低下的缺陷,同时由于两个模型的输出数据相互独立,存在输出存在信息残缺不完整、缺乏关联性,数据利用率差的缺陷,例如一个句子中通过一个模型获得AB两个实体,通过另一个模型获得评价,但是不知道评价是对谁。
发明内容
本发明为解决现有技术中存在的上述缺陷,提出一种情感分析的装置和方法。
为了实现以上目的,本发明提出了一种情感分析的装置,包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:
特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;
特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;
实体抽取网络模块用以根据实体识别特征集抽取实体词;
情感提取网络模块用以根据句子特征向量集得到情感词特征向量;;
特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;
情感分类模块根据增强的情感特征输出情感类型。
进一步地,所述特征抽取模块采用Bert神经网络模型实现。
进一步地,所述特征优化模块采用双层LSTM神经网络模型实现。
进一步地,所述实体抽取网络模块包括分类器和抽取实体词模块,所述分类器用于得到实体词的位置,所述抽取实体词模块用于得到实体词的内容。
进一步的,所述实体抽取网络模块包括三个分类器,所述三个分类器分别用于抽取实体词的开始位置、中间位置和结束位置。
进一步的,所述情感提取网络模块包括动态特征加权模块、特征屏蔽模块和情感特征抽取模块,其中:
动态特征加权模块:用以根据离中心字特征向量的距离远近设置句子中每个字特征向量的权重,距离越远权重越小;
特征屏蔽模块:用以对距离中心字特征向量的值大于阈值的字进行屏蔽处理;
情感特征抽取模块:用以从处理过的句子特征向量集中抽取情感词特征向量。
进一步的,所述阈值是5个字长。
进一步的,所述情感特征抽取模块采用三层神经网络。
本发明还公开一种情感分析的方法,包括:
情感分析的装置读入有标签的句子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大参林医疗健康科技有限公司,未经上海大参林医疗健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111202789.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种OCR识别纠错装置和方法
- 下一篇:一种高强度铁塔主杆及其制备方法





