[发明专利]识别中文情感的方法及装置、计算机设备、存储介质在审

专利信息
申请号: 201910534905.X 申请日: 2019-06-20
公开(公告)号: CN110413772A 公开(公告)日: 2019-11-05
发明(设计)人: 张师琲 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F17/27;G06K9/62
代理公司: 北京中强智尚知识产权代理有限公司 11448 代理人: 黄耀威
地址: 518000 广东省深圳市福田街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 情感识别 中文文本 计算机设备 存储介质 特征向量 分词 中文 模型识别 算法训练 特征监测 贝叶斯 识别率 算法 分析
【说明书】:

发明实施例提供了一种识别中文情感的方法及装置、计算机设备、存储介质。一方面,该方法包括:接收待识别的目标中文文本;对所述目标中文文本进行分词,计算各个分词的特征向量;将所述特征向量输入到情感识别模型,其中,所述情感识别模型是采用贝叶斯算法和卡方特征监测算法训练得到的;使用所述情感识别模型识别所述目标中文文本的情感属性。通过本发明,解决了现有技术中中文情感识别率低的技术问题,提高了情感的识别率,提高了机器分析中文文本的效率。

【技术领域】

本发明涉及计算机领域,尤其涉及一种识别中文情感的方法及装置、计算机设备、存储介质。

【背景技术】

情感识别是大数据中分析人物画像的重要分支,通过对文本的情感识别,可以进一步了解作者的性格,意图等特性。

现有技术中,由于中文语义的博大精深,很多语句都是具备隐含词义,不能单凭字面意思来判断中文的情感,需要结合文本中的上下文语境才能体会真实的情感所在,目前还没有有效的情感识别方案,,有些通过标题来判断整篇文章的情感倾向,但仅通过文本的标题来判断文本情感,识别率太低,需要大量的人工干预和进一步识别。

针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。

【发明内容】

有鉴于此,本发明实施例提供了一种识别中文情感的方法及装置、计算机设备、存储介质。

一方面,本发明实施例提供了一种识别中文情感的方法,所述方法包括:接收待识别的目标中文文本;对所述目标中文文本进行分词,计算各个分词的特征向量;将所述特征向量输入到情感识别模型,其中,所述情感识别模型是采用贝叶斯算法和卡方特征监测算法训练得到的;使用所述情感识别模型识别所述目标中文文本的情感属性。

可选的,在将所述特征向量输入到情感识别模型之前,所述方法还包括:确定多个带有情感标签的中文文本样本;使用所述中文文本样本训练初始神经网络模型,得到所述情感识别模型。

可选的,使用所述中文文本样本训练初始神经网络模型包括:对所述中文文本样本进行分词处理;采用香农函数计算各个分词的特征向量;采用贝叶斯算法对各个特征向量进行情感属性的分类;对各个特征向量的分类结果进行卡方校验,根据校验结果选择预设数量的词作为每个情感属性的关键词,其中,所述情感识别模型中的每个情感模型由多个关键词的特征向量组成。

可选的,采用香农函数计算各个分词的特征向量包括:分词x的特征向量H(X)为:其中,P(x)为X中x出现的概率,X为中文文本样本。

可选的,采用贝叶斯算法对各个特征向量进行情感属性的分类包括:计算P(Cj),以及P(wi|Cj);采用以下朴素贝叶斯分类算法进行分类:其中,CNB是当前分词的情感属性,P(Cj)为当前分词在j情感属性的样本中出现的概率,ΠP(wi|Cj)指在在j情感属性的样本中分词在整个文档中出现的概率的乘积,P(wi|cj)为在Cj发生概率下,wi发生的概率,Cj表示当前分词的情感属性为j,wi为表示整个文档的情感属性为i。

可选的,在采用朴素贝叶斯分类算法进行分类之前,所述方法还包括:采用以下算法进行拉普拉斯平滑转换:其中,count(c)为c类的文本个数,count(w,c)是c类中词汇w的个数,v是中文文本样本的词汇总量,一个中文文本样本中所有出现的词的频率合计为1,为中文文本样本中未出现词汇的概率,c类为情感属性的任一类型。

可选的,对各个特征向量的分类结果进行卡方校验包括:使用以下偏差程度的计算公式对各个特征向量的分类结果进行卡方校验:其中,理论值为E,xi为观察值,i为任一分词的序号;取S的top k作为校验结果,其中,k为小于或等于n的正整数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910534905.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top