[发明专利]一种文本情感分类方法及装置在审

专利信息
申请号: 201910941279.6 申请日: 2019-09-30
公开(公告)号: CN112667803A 公开(公告)日: 2021-04-16
发明(设计)人: 戴泽辉 申请(专利权)人: 北京国双科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/289;G06F40/30;G06K9/62
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王娇娇
地址: 100083 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 情感 分类 方法 装置
【权利要求书】:

1.一种文本情感分类方法,其特征在于,包括:

获取待分类文本;

基于目标文本编码模型分析所述待分类文本的上下文语义信息,得到所述待分类文本对应的文本向量;其中,所述目标文本编码模型利用与所述待分类文本属于相同领域的语料对预训练的通用文本编码模型进行继续训练得到;

获取所述待分类文本中的情感分类属性词的位置信息对应的位置向量;

将所述文本向量及所述位置向量进行拼接,得到文本及位置向量;

基于目标情感分类模型分析所述文本及位置向量,得到所述待分类文本中的情感分类属性词所属的目标情感类别。

2.根据权利要求1所述的方法,其特征在于,所述基于目标文本编码模型分析所述待分类文本的上下文语义信息,得到所述待分类文本对应的文本向量,包括:

以字为单位对所述待分类文本进行划分,得到文本划分结果;

基于所述目标文本编码模型,全向分析所述文本划分结果中的每个字在所述待分类文本中的语义,得到每个字对应的字向量;

按照所述文本划分结果中每个字对应的顺序,将每个字对应的字向量拼接为文本向量。

3.根据权利要求1或2所述的方法,其特征在于,利用与所述待分类文本属于相同领域的语料对预训练的通用文本编码模型进行继续训练的过程包括:

获取与所述待分类文本属于相同领域的多条文本语料;

随机遮盖每条所述文本语料中的词语,并标注每条文本语料中被遮盖词语的正确词语,得到训练文本语料;

基于预训练的通用文本编码模型,预测每条所述训练文本语料中被遮盖词语对应的预测结果;

依据同一条训练文本语料对应的预测结果及标注的正确词语,反复优化所述通用文本编码模型中的模型参数直到满足收敛条件,得到目标文本编码模型。

4.根据权利要求1所述的方法,其特征在于,所述获取所述待分类文本中的情感分类属性词的位置信息对应的位置向量,包括:

确定所述待分类文本中的情感分类属性词;

将所述情感分类属性词中的每个字标记为第一预设二进制数值,以及,将所述待分类文本中除所述情感分类属性词之外的其它字标记为不同于所述第一预设二进制数值的其它数值,根据每个字对应的数值得到所述情感分类属性词对应的位置向量。

5.根据权利要求1所述的方法,其特征在于,所述获取所述待分类文本中的情感分类属性词的位置信息对应的位置向量,包括:

确定所述待分类文本中的情感分类属性词;

将所述情感分类属性词标记为第一预设二进制数值,以及,将所述待分类文本中除所述情感分类属性词之外的其它词语分别标记为不同于所述第一预设二进制数值的其它数值,根据所述待分类文本中每个词语对应的数值得到所述情感分类属性词对应的位置向量。

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取训练文本样本,所述训练文本样本标注有情感分类属性词及所述情感分类属性词所属情感类别;

基于与所述目标文本编码模型,分析所述训练文本样本的上下文语义信息,得到所述待分类文本对应的文本向量;

获取所述训练文本样本标注的情感分类属性词的位置信息对应的位置向量;

将所述训练文本样本对应的文本向量及情感分类属性词的位置向量进行拼接,得到所述训练文本样本的文本及位置向量;

基于待训练情感分类模型分析所述训练文本样本的文本及位置向量,得到所述训练文本样本中标注的情感分类属性词的情感分类结果;

基于同一条训练文本样本中情感分类属性词对应的情感分类结果及标注的情感类别,反复优化所述待训练情感分类模型中的模型参数直到满足相应的收敛条件,得到所述目标情感分类模型。

7.根据权利要求1所述的方法,其特征在于,所述基于目标情感分类模型分析所述文本及位置向量,得到所述待分类文本中的情感分类属性词所属的目标情感类别,包括:

基于目标情感分类模型分析所述文本及位置向量,得到所述待分类文本中的情感分类属性词属于各个预设情感类别的置信度;

选取置信度最大的情感类别为所述待分类文本中的情感分类属性词所属的目标情感类别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910941279.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top