[发明专利]一种数据打标签分类方法、装置、终端及存储介质在审
申请号: | 201910556460.5 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110413775A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 孙瑛瑛;陈生;闫刚;楚国庆;金竹;刘洋 | 申请(专利权)人: | 北京清博大数据科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 苏友娟 |
地址: | 100044 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种数据打标签分类方法、装置、终端及存储介质,该方法包括:对已打标签文本进行预处理,分别生成词向量训练集和BERT语言训练集;分别通过所述词向量训练集对多种神经网络模型中的每种进行训练,且通过所述BERT语言训练集对BERT分类模型进行训练;根据训练结果确定融合模型;根据所述融合模型对目标数据进行打标签分类。本发明提供的数据打标签分类方法、装置、终端及存储介质,可以对海量数据进行打标签分类,提高了分类的准确性。 | ||
搜索关键词: | 标签分类 存储介质 数据打 语言训练 终端 词向量 训练集 预处理 神经网络模型 标签文本 分类模型 海量数据 目标数据 训练结果 融合 分类 | ||
【主权项】:
1.一种数据打标签分类方法,其特征在于,包括:对已打标签文本进行预处理,分别生成词向量训练集和BERT语言训练集;分别通过所述词向量训练集对多种神经网络模型中的每种进行训练,且通过所述BERT语言训练集对BERT分类模型进行训练;根据训练结果确定融合模型;根据所述融合模型对目标数据进行打标签分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清博大数据科技有限公司,未经北京清博大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910556460.5/,转载请声明来源钻瓜专利网。