[发明专利]微博数据正负面识别方法在审
| 申请号: | 202211246647.3 | 申请日: | 2022-10-12 |
| 公开(公告)号: | CN115544255A | 公开(公告)日: | 2022-12-30 |
| 发明(设计)人: | 郝静 | 申请(专利权)人: | 天津海量信息技术股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 合肥昕华汇联专利代理事务所(普通合伙) 34176 | 代理人: | 祁娜 |
| 地址: | 300450 天津市滨海新区*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了微博数据正负面识别方法,包括以下步骤:S1、预处理;S2、文本分词;S3、训练词向量;S4、生成字向量矩阵;S5、生成词向量矩阵;S6、生成字向量与词向量拼接矩阵;S7、获得识别结果。本发明通过先将微博杂质文本过滤,避免无效语句影响模型效果,同时使用了海量分词,对文本进行分析并对特殊词进行归一化处理,减少对模型的影响,同时使用了bert模型和word2vec模型,融合了bert模型基于句子的字向量表示和基于上下文的词向量表示,丰富了文本的特征表示,由此作为textcnn深度学习模型,训练出的准确率更高,从而实现了可以高效并准确识别短文本情感的正负面。 | ||
| 搜索关键词: | 数据 负面 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津海量信息技术股份有限公司,未经天津海量信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211246647.3/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





