[发明专利]用于文本分类的方法及装置、电子设备、存储介质在审
| 申请号: | 202110800737.1 | 申请日: | 2021-07-15 |
| 公开(公告)号: | CN113420138A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 李嘉琛;付骁弈 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/194;G06F40/242 |
| 代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 陶俊洁 |
| 地址: | 200000 上海市徐汇区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 文本 分类 方法 装置 电子设备 存储 介质 | ||
1.一种用于文本分类的方法,其特征在于,包括:
获取待分类文本;所述待分类文本包括多个待分类文本子句;
利用预设的关键词词典从各所述待分类文本子句中查询出文本类型标签对应的关键词;所述关键词词典中存储有关键词与文本类型标签之间的对应关系;
根据所述关键词确定所述待分类文本对应的分类标签;
确定各所述待分类文本子句与所述分类标签之间的关联评分;
根据各所述关联评分确定所述待分类文本的分类结果及分类依据。
2.根据权利要求1所述的方法,其特征在于,根据所述关键词确定所述待分类文本对应的分类标签,包括:
将所述关键词对应的文本类型标签确定为所述待分类文本对应的分类标签。
3.根据权利要求1所述的方法,其特征在于,确定各所述待分类文本子句与所述分类标签之间的关联评分,包括:
只存在一个分类标签的情况下,获取各所述待分类文本子句中查询出的关键词第一数量,获取各所述待分类文本子句的长度;根据第一预设算法利用各所述关键词第一数量和各所述长度进行计算,获得各所述待分类文本子句与所述分类标签之间的关联评分;或,
存在多个分类标签的情况下,分别获取各所述待分类文本子句中各所述分类标签对应的关键词第二数量,分别获取各所述待分类文本子句的长度;根据所述第一预设算法利用各所述关键词第二数量和各所述长度进行计算,获得各所述待分类文本子句与各所述分类标签之间的关联评分。
4.根据权利要求1所述的方法,其特征在于,根据各所述关联评分确定所述待分类文本的分类依据,包括:
将最高的关联评分对应的待分类文本子句确定为所述待分类文本的分类依据;或,
根据第二预设算法利用所述关联评分进行迭代计算,获得各所述待分类文本子句的迭代分数;根据所述迭代分数确定所述待分类文本的分类依据。
5.根据权利要求4所述的方法,其特征在于,根据所述迭代分数确定所述待分类文本的分类依据,包括:
将迭代分数最高的待分类文本子句确定为所述待分类文本的分类依据。
6.根据权利要求1至5任一项所述的方法,其特征在于,根据各所述关联评分确定所述待分类文本的分类结果,包括:
将最高的关联评分对应的分类标签确定为所述待分类文本的分类结果。
7.一种用于文本分类的装置,其特征在于,包括:
获取模块,被配置为获取待分类文本;所述待分类文本包括多个待分类文本子句;
查询模块,被配置为利用预设的关键词词典从各所述待分类文本子句中查询出文本类型标签对应的关键词;所述关键词词典中存储有关键词与文本类型标签之间的对应关系;
第一确定模块,被配置为根据所述关键词确定所述待分类文本对应的分类标签;
第二确定模块,被配置为确定各所述待分类文本子句与所述分类标签之间的关联评分;
第三确定模块,被配置为根据各所述关联评分确定所述待分类文本的分类结果及分类依据。
8.一种用于文本分类的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至6任一项所述的方法。
9.一种电子设备,其特征在于,包括如权利要求8所述的用于文本分类的装置。
10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至6任一项所述的用于文本分类的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110800737.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扭矩放大器行星架
- 下一篇:一种海上风电装配式钢结构风机承台





