[发明专利]方面级别情感分类方法、装置、设备及可读存储介质在审

专利信息
申请号: 202011227233.7 申请日: 2020-11-06
公开(公告)号: CN112347787A 公开(公告)日: 2021-02-09
发明(设计)人: 刘剑;杨海钦;姚晓远 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F16/35;G06F16/33;G06K9/62;G06N3/02
代理公司: 北京英特普罗知识产权代理有限公司 11015 代理人: 程超
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 方面 级别 情感 分类 方法 装置 设备 可读 存储 介质
【说明书】:

发明公开了一种方面级别情感分类方法、装置、设备及可读存储介质,所述方法包括:获取待分类文本,并将包含在所述待分类文本中的关键词转化为令牌,以形成令牌序列;其中,所述令牌序列包括T个令牌;将所述令牌序列输入到预设的令牌处理模型中,以得到概率矩阵;其中,所述概率矩阵为T列、(T+1)行的矩阵;将所述属于方面术语的概率值大于预设阈值的令牌设置为目标令牌,并将与所述目标令牌对应的第二行至第(T+1)行的概率值形成情感令牌概率序列;基于所述情感令牌概率序列,利用预设的Transformer模型和分类器,确定出与所述待分类文本对应的情感类型;本发明能够实现跨领域的方面级别情感分析。

技术领域

本发明涉及语音语义技术领域,特别涉及一种方面级别情感分类方法、装置、设备及可读存储介质。

背景技术

随着网络社交媒体的崛起,互联网上产生了大量的用户评论信息,这些用户评论信息中表达了各种各样的情感色彩和情感倾向性,通过对用户评论信息进行情感分析,可以了解大众舆论对于某一时事件或产品的看法。

情感分析是一个对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,为了充分的获取某文本中各个方面的情感倾向,提出方面级别的情感分析,将分析的粒度细化到方面的级别;现有技术中大多通过监督学习的方式训练神经网络模型,以获取用于方面级别情感分析的情感分类器,不可避免的,以监督学习的方式训练神经网络模型的过程中需要大量的被标记的训练样本,缺乏被标记的训练样本成为获取情感分类器的主要障碍。

因此,如何避免获取情感分类器无足够被标记的训练样本的障碍,如何利用预训练模型的强大特征表征能力,实现跨领域的方面级别情感分析,是本领域技术人员需要解决的问题。

发明内容

本发明的目的在于提供一种方面级别情感分类方法、装置、设备及可读存储介质,能够实现跨领域的方面级别情感分析。

根据本发明的一个方面,提供了一种方面级别情感分类方法,所述方法包括:

获取待分类文本,并将包含在所述待分类文本中的关键词转化为令牌,以形成令牌序列;其中,所述令牌序列包括T个令牌;

将所述令牌序列输入到预设的令牌处理模型中,以得到概率矩阵;其中,所述概率矩阵为T列、(T+1)行的矩阵,所述概率矩阵的每一列表征一种令牌,所述概率矩阵的第一行表征各个令牌属于方面术语的概率值、第二行至第(T+1)行表征每个令牌属于与对应方面术语相映射的情感令牌的概率值;

将所述属于方面术语的概率值大于预设阈值的令牌设置为目标令牌,并将与所述目标令牌对应的第二行至第(T+1)行的概率值形成情感令牌概率序列;

基于所述情感令牌概率序列,利用预设的Transformer模型和分类器,确定出与所述待分类文本对应的情感类型。

可选的,所述获取待分类文本,并将包含在所述待分类文本中的关键词转化为令牌,以形成令牌序列,具体包括:

对所述待分类文本进行分词处理,以得到包含在所述待分类文本中的T个关键词;

分别对每个关键词进行编码,以得到每个关键词的令牌;

将所有令牌组成所述令牌序列。

可选的,所述将所述令牌序列输入到预设的令牌处理模型中,以得到概率矩阵,具体包括:

将所述令牌序列输入到所述令牌处理模型中的BERT模型中,得到每个令牌对应的融合了前后令牌信息的特征表征,并将所有所述特征表征组成特征表征序列;

将所述特征表征序列输入到所述令牌处理模型中的全连接层中,并通过softmax函数对所述全连接层的输出进行归一化处理,以得到所述概率矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011227233.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top