[发明专利]一种基于多长度文本向量拼接的舆情分析方法及其系统有效
申请号: | 201810688997.2 | 申请日: | 2018-06-28 |
公开(公告)号: | CN110727758B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 盛益强;佟泽雨;刘学;邓浩江 | 申请(专利权)人: | 郑州芯兰德网络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/205;G06F18/241;G06N3/0499;G06N3/08;G06N20/10;G06F18/214;G06N20/20 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;刘振 |
地址: | 450001 河南省郑州市高新技术产*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多长度文本向量拼接的舆情分析方法,该方法包括:步骤1)将文本数据转化成多维度文本向量;其中,所述多维度文本向量包括:n维度、2n维度的短段落向量和4n维度、8n维度的中等长度段落向量;步骤2)将步骤1)中的多维度文本向量间横向首尾顺次拼接,获得长段落向量;步骤3)采用不同的机器学习模型,对步骤2)中得到的长段落向量进行预测,获得不同的情感积极消极倾向概率值;不同的机器学习模型及其对应获得的概率值对应生成不同的向量;步骤4)将步骤3)中的向量和步骤2)获得的长段落向量进行拼接,获得15n+6维度的段落文本向量,利用前馈神经网络模型对其进行判断,获得情感积极或消极倾向。 | ||
搜索关键词: | 一种 基于 多长 文本 向量 拼接 舆情 分析 方法 及其 系统 | ||
【主权项】:
1.一种基于多长度文本向量拼接的舆情分析方法,其特征在于,该方法包括:/n步骤1)将文本数据转化成多维度文本向量;其中,所述多维度文本向量包括:n维度、2n维度的短段落向量和4n维度、8n维度的中等长度段落向量;/n步骤2)将步骤1)中的多维度文本向量间横向首尾顺次拼接,获得长段落向量;/n步骤3)采用不同的机器学习模型,对步骤2)中得到的长段落向量进行预测,获得不同的情感积极消极倾向概率值;不同的机器学习模型及其对应获得的情感积极消极倾向概率值对应生成不同的向量;/n步骤4)将步骤3)中的向量和步骤2)获得的长段落向量进行拼接,获得15n+6维度的段落文本向量,利用前馈神经网络模型对其进行判断,获得情感积极或消极倾向。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州芯兰德网络科技有限公司,未经郑州芯兰德网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810688997.2/,转载请声明来源钻瓜专利网。