[发明专利]基于功能拆分的串行多层文本情感分类方法及装置在审
申请号: | 202210366894.0 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114722201A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 李瑞男 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;王维宁 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 功能 拆分 串行 多层 文本 情感 分类 方法 装置 | ||
本发明提供了一种基于功能拆分的串行多层文本情感分类方法及装置,对应的方法包括:爬取多个待分类的评论文本;根据预生成的情感分类器对待分类的评论文本进行分类,其中情感分类器是对预设的情感文本库进行embedding训练而生成的。本发明通过将多分类模型,结合业务背景,拆分成两个二分类模型,从而使得每个模型都具有明确单一的分类任务,从而提高模型的识别能力。其次,通过前置分类器过滤掉无意义的文本类型,从而减轻后置核心分类器的预测压力,同时前置和后置分类器中间可以设置缓冲器,从而提高模型整体的并发处理能力。
技术领域
本申请属于大数据技术领域,特别是设计分布式账务处理的技术领域,具体涉及一种基于功能拆分的串行多层文本情感分类方法及装置。
背景技术
各大公司对于自己研发的应用软件往往通过用户的反馈来进行修改以及优化,而各大应用商店对于该应用软件的评价往往是这种反馈主要的且直接的来源。在查看应用商店中针对软件评价的过程中,往往存在很多无意义类型的文本,导致现有技术中的三分类模型无法很好的聚焦积极以及消极文本分类的预测目的。
发明内容
本发明可用于大数据在金融方面应用的技术领域,也可用于除金融领域之外的任意领域,本发明所提供的基于功能拆分的串行多层文本情感分类方法及装置,一方面,从业务层面进一步精细化评论文本情感分类,创造性提出无意义文本对分类模型的影响并提出解决方案,提高了模型的效果。另一方面,本发明从技术层面设计了通用的多层分类架构,实现模型可配置化选型和强大的并行处理能力。最终提高了软件商店中对于目标应用程序的评论识别能力,帮助用户快速获取需要的评论,从而基于评论改善软件提供助力。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种基于功能拆分的串行多层文本情感分类方法包括:
爬取多个待分类的评论文本;
根据预生成的情感分类器对所述待分类的评论文本进行分类,其中情感分类器是对预设的情感文本库进行embedding训练而生成的。
一实施例中,生成所述情感文本库包括:
对多个评论文本进行双层打标;
根据双层打标结果生成所述情感文本库。
一实施例中,所述对多个评论文本进行双层打标包括:
对所述多个评论文本进行第一层打标;
根据第一层打标结果将所述多个评论文本划分为有意义文本以及无意义文本。
一实施例中,所述对多个评论文本进行双层打标还包括:
对所述有意义文本进行第二层打标;
根据第二层打标结果将所述有意义文本划分为积极文本以及消极文本。
一实施例中,情感分类器包括前置分类器以及后置分类器,生成所述情感分类器的方法包括:
根据所述有意义文本以及所述无意义文本进行所述embedding训练,以生成所述前置分类器;
根据所述积极文本以及消极文本进行所述embedding训练,以生成所述后置分类器。
一实施例中,所述根据预生成的情感分类器对所述待分类的评论文本进行分类包括:
根据所述前置分类器将所述待分类的评论文本划分为有意义文本以及无意义文本;
根据所述后置分类器将所述有意义文本划分为积极文本以及消极文本。
第二方面,本发明提供一种基于功能拆分的串行多层文本情感分类方法及装置,该装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210366894.0/2.html,转载请声明来源钻瓜专利网。