[发明专利]一种自主升级且抗噪的文本情感分析系统有效
申请号: | 201810930606.3 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109165298B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 陈福;刘洋 | 申请(专利权)人: | 上海五节数据科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/9535 |
代理公司: | 上海牧信专利代理事务所(普通合伙) 31416 | 代理人: | 盛际丰 |
地址: | 201100 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自主 升级 文本 情感 分析 系统 | ||
1.一种自主升级且抗噪的文本情感分析系统,其特征在于,包括用户端、后台端、文本情感判断系统;所述文本情感判断系统包括媒介分类模块、行业分类模块、媒介引擎组、行业引擎组、规则学习引擎组;
所述媒介分类模块获取待情感分析的文本内容,判断其是否来源于媒介,如果文本内容是来源于媒介,再将其发送给相应媒介类型的媒介特征词典,反之则不发送给媒介特征词典;所述媒介类型包括评论、新闻、博客、微信、微博,所述媒介特征词典对应地包括评论类特征词典、新闻类特征词典、博客类特征词典、微信类特征词典、微博类特征词典;
所述媒介特征词典接收相应媒介类型的待情感分析文本内容,通过分词模块生成待情感分析的词汇,生成的所述待情感分析的词汇均发送给媒介特征提取模块组内的M个媒介特征提取模块,所述媒介特征提取模块包括第一媒介特征提取模块、第二媒介特征提取模块、第三媒介特征提取模块至第M媒介特征提取模块,M为整数,每个所述媒介特征提取模块将各自提取的特征向量均发送给媒介特征选择模块组内的N个媒介特征选择模块,所述媒介特征选择模块包括第一媒介特征选择模块、第二媒介特征选择模块至第N媒介特征选择模块,N为整数,每个所述媒介特征选择模块将各自选择的特征向量发送给所述媒介引擎组;
所述媒介引擎组包括媒介深度学习引擎组和媒介机器学习引擎组,所述媒介深度学习引擎组包括Q个基于深度学习算法模型、实现情感判断的媒介深度学习引擎,Q为整数,所述媒介机器学习引擎组包括S个基于机器学习算法模型、实现情感判断的媒介机器学习引擎,S为整数,所述媒介引擎组基于相应的算法模型,对接收到的由所述媒介特征选择模块发送来的特征向量进行计算,计算出各个所述待情感分析的词汇的情感分析结果数据,所述媒介引擎组将计算出的情感分析结果数据发送给媒介情感倾向判断模块;
所述媒介情感倾向判断模块用于判断各个情感分析结果数据是否正确,并将判断结果数据发送给规则学习引擎组;
所述行业分类模块获取待情感分析的文本内容,判断其是否存在归属的行业领域,如果文本内容是存在归属的行业领域,再将其发送给相应行业领域的行业特征词典,反之则不发送给行业特征词典;所述行业领域包括餐饮、电子、汽车、通信、服装,所述行业特征词典对应地包括餐饮领域特征词典、电子领域特征词典、汽车领域特征词典、通信领域特征词典、服装领域特征词典;
所述行业特征词典接收相应行业领域的待情感分析文本内容,通过分词模块生成待情感分析的词汇,生成的所述待情感分析的词汇均发送给行业特征提取模块组内的X个行业特征提取模块,所述行业特征提取模块包括第一行业特征提取模块、第二行业特征提取模块、第三行业特征提取模块至第X行业特征提取模块,X为整数,每个所述行业特征提取模块将各自提取的特征向量均发送给行业特征选择模块组内的Y个行业特征选择模块,所述行业特征选择模块包括第一行业特征选择模块、第二行业特征选择模块至第Y行业特征选择模块,Y为整数,每个所述行业特征选择模块将各自选择的特征向量发送给所述行业引擎组;
所述行业引擎组包括行业深度学习引擎组和行业机器学习引擎组,所述行业深度学习引擎组包括U个基于深度学习算法模型、实现情感判断的行业深度学习引擎,U为整数,所述行业机器学习引擎组包括V个基于机器学习算法模型、实现情感判断的行业机器学习引擎,V为整数,所述行业引擎组基于相应的算法模型,对接收到的由所述行业特征选择模块发送来的特征向量进行计算,计算出各个所述待情感分析的词汇的情感分析结果数据,所述行业引擎组将计算出的情感分析结果数据发送给行业情感倾向判断模块;
所述行业情感倾向判断模块用于判断各个情感分析结果数据是否正确,并将判断结果数据发送给规则学习引擎组;
所述规则学习引擎组依据接收到的由所述媒介情感倾向判断模块、行业情感倾向判断模块发来的判断结果数据,统计M*N(Q+S)条或/和X*Y(U+V)条情感判断路径对待情感分析的文本内容情感倾向判断的准确率,为不同媒介类型、行业领域文本匹配准确率最高的情感判断路径;同时所述规则学习引擎组根据已知的判断结果数据,在线训练现有的深度学习算法模型或机器学习算法模型来形成新的深度学习算法模型或机器学习算法模型,并将新的深度学习算法模型或机器学习算法模型加入媒介引擎组或行业引擎组与现有的深度学习算法模型或机器学习算法模型进行优劣比较,实现深度学习算法模型或机器学习算法模型的迭代升级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海五节数据科技有限公司,未经上海五节数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810930606.3/1.html,转载请声明来源钻瓜专利网。