[发明专利]基于功能拆分的串行多层文本情感分类方法及装置在审
申请号: | 202210366894.0 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114722201A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 李瑞男 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;王维宁 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 功能 拆分 串行 多层 文本 情感 分类 方法 装置 | ||
1.一种基于功能拆分的串行多层文本情感分类方法,其特征在于,包括:
爬取多个待分类的评论文本;
根据预生成的情感分类器对所述待分类的评论文本进行分类,其中情感分类器是对预设的情感文本库进行embedding训练而生成的。
2.如权利要求1所述的基于功能拆分的串行多层文本情感分类方法,其特征在于,生成所述情感文本库包括:
对多个评论文本进行双层打标;
根据双层打标结果生成所述情感文本库。
3.如权利要求2所述的基于功能拆分的串行多层文本情感分类方法,其特征在于,所述对多个评论文本进行双层打标包括:
对所述多个评论文本进行第一层打标;
根据第一层打标结果将所述多个评论文本划分为有意义文本以及无意义文本。
4.如权利要求3所述的基于功能拆分的串行多层文本情感分类方法,其特征在于,所述对多个评论文本进行双层打标还包括:
对所述有意义文本进行第二层打标;
根据第二层打标结果将所述有意义文本划分为积极文本以及消极文本。
5.如权利要求4所述的基于功能拆分的串行多层文本情感分类方法,其特征在于,情感分类器包括前置分类器以及后置分类器,生成所述情感分类器的方法包括:
根据所述有意义文本以及所述无意义文本进行所述embedding训练,以生成所述前置分类器;
根据所述积极文本以及消极文本进行所述embedding训练,以生成所述后置分类器。
6.如权利要求5所述的基于功能拆分的串行多层文本情感分类方法,其特征在于,所述根据预生成的情感分类器对所述待分类的评论文本进行分类包括:
根据所述前置分类器将所述待分类的评论文本划分为有意义文本以及无意义文本;
根据所述后置分类器将所述有意义文本划分为积极文本以及消极文本。
7.一种基于功能拆分的串行多层文本情感分类装置,其特征在于,包括:
评论文本爬取模块,用于爬取多个待分类的评论文本;
评论文本情感分类模块,用于根据预生成的情感分类器对所述待分类的评论文本进行分类,其中情感分类器是对预设的情感文本库进行embedding训练而生成的。
8.如权利要求7所述的基于功能拆分的串行多层文本情感分类装置,其特征在于,还包括:情感文本库生成模块,用于生成所述情感文本库,所述情感文本库生成模块包括:
评论文本双层打标单元,用于对多个评论文本进行双层打标;
情感文本库生成单元,用于根据双层打标结果生成所述情感文本库。
9.如权利要求8所述的基于功能拆分的串行多层文本情感分类装置,其特征在于,所述评论文本双层打标单元包括:
第一打标单元,用于对所述多个评论文本进行第一层打标;
意义第一划分单元,用于根据第一层打标结果将所述多个评论文本划分为有意义文本以及无意义文本。
10.如权利要求9所述的基于功能拆分的串行多层文本情感分类装置,其特征在于,所述评论文本双层打标单元还包括:
第二打标单元,用于对所述有意义文本进行第二层打标;
情感第一划分单元,用于根据第二层打标结果将所述有意义文本划分为积极文本以及消极文本。
11.如权利要求10所述的基于功能拆分的串行多层文本情感分类装置,其特征在于,还包括:情感分类器生成模块,用于生成所述情感分类器,情感分类器包括前置分类器以及后置分类器,所述情感分类器生成模块包括:
前置分类器生成单元,用于根据所述有意义文本以及所述无意义文本进行所述embedding训练,以生成所述前置分类器;
后置分类器生成单元,用于根据所述积极文本以及消极文本进行所述embedding训练,以生成所述后置分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210366894.0/1.html,转载请声明来源钻瓜专利网。