[发明专利]一种基于文本相似度的事件情感分类方法有效
申请号: | 201810642911.2 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108959479B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 辛如意 | 申请(专利权)人: | 成都睿码科技有限责任公司;杭州数峰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 廖慧敏 |
地址: | 610000 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于文本相似度的事件情感分类方法,包括以下操作步骤:S000、设整个待处理事件的情感值为S;S001、选取并生成单文本情感分类模型;S002、根据余弦相似度将文本聚类;S003、设置事件的分割参数;S004、针对每一个事件类event,按照声量值分类选择文本判断分析;S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;S006、事件内部存在情感倾向的文本,计算其情感值;S007、利用情感分类模型对事件情感值进行计算;S008、判断事件情感分类。本技术方案可针对大量文本进行监测分析,且减少人工参数,快速判断出事件的情感分类,从而达到对舆情进行监测的目的。 | ||
搜索关键词: | 一种 基于 文本 相似 事件 情感 分类 方法 | ||
【主权项】:
1.一种基于文本相似度的事件情感分类方法,其特征在于,包括以下操作步骤:S000、设整个待处理事件的情感值为S,设情感分界值分别为S1、S2;S001、选取并生成单文本情感分类模型model,情感类别为正面、中立、负面;S002、根据余弦相似度将文本聚类,聚合成不同的事件类;S003、设置事件的分割参数limit‑num,用来控制事件中的文本切割参数;S004、针对每一个事件类event,按照声量值选择文本,然后判断分析;S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;S006、事件内部存在情感倾向的文本,计算情感值;S007、利用情感分类模型对事件情感值进行计算(综合w1,w2),其中,w1+w2=1;S008、判断事件情感分类s=p(event),若s≥s2,则事件为正向;若s1
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿码科技有限责任公司;杭州数峰科技有限公司,未经成都睿码科技有限责任公司;杭州数峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810642911.2/,转载请声明来源钻瓜专利网。