[发明专利]一种基于语料的分类方法、装置,电子设备及存储介质在审
申请号: | 202110776249.1 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113626592A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 李丰军;周剑光;朱元豪 | 申请(专利权)人: | 中汽创智科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 211100 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语料 分类 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供了一种基于语料的分类方法、装置、电子设备及存储介质,方法包括:根据目标语料确定分类标注信息集合;确定目标语料中的语句对应的句向量序列集合;将句向量序列集合输入已训练好的二叉树分类模型,确定出目标语料中每个语句对应的第一分类标注信息;将句向量序列集合输入已训练好的SVM分类模型,确定出目标语料中每个语句对应的第二分类标注信息;将句向量序列集合输入已训练好的深度学习分类模型,确定出目标语料中每个语句对应的第三分类标注信息;基于目标语料中每个语句对应的分类标注信息,确定每个语句对应的失效模式信息。本公开实施例可以基于语料进行精细的分类,同时节省计算资源。
技术领域
本发明涉及计算机软件技术领域,尤其涉及一种基于语料的分类方法、装置,电子设备及存储介质。
背景技术
随着工业化和信息化的深度融合,企业能够获得的数据资源也越来越多,因此需要对如何更好地利用数据资源进行研究,以充分利用数据资源,提高产品质量,改善企业制造效率。在工业研发和生产过程中,常需要对售出的产品进行故障监控,因此广泛存在着基于语料进行质量问题分类的需求。导致质量问题的原因错综复杂,不同的质量问题的影响因素不一样,其产生的场景也不一样,产生质量问题的对象也不一样。
基于语料的质量问题提取和分类的方法可以直接挖掘网络上的非结构化数据,使用自然语言处理工具提取网上的评论等信息,并对文本进行分类,最终将非结构化的数据转化成结构化数据,将每一个产品型号的每一类问题的频次都累积统计并存入数据库中。但是现在的分类方法无法对质量问题进行足够细致的分类,导致企业无法充分地运用海量的语料资源,也无法更好地针对产品的质量进行改进。
发明内容
针对现有技术存在的缺陷,本公开实施例提供一种基于语料的分类方法,可以基于语料进行精细的分类,同时节省计算资源。
本公开实施例提供了一种基于语料的分类方法,方法包括:根据目标语料确定分类标注信息集合;分类标注信息集合包括第一分类标注信息集合、第二分类标注信息集合和第三分类标注信息集合;确定目标语料中的语句对应的句向量序列集合;将句向量序列集合输入已训练好的二叉树分类模型,确定出目标语料中每个语句对应的第一分类标注信息;将句向量序列集合输入已训练好的SVM分类模型,确定出目标语料中每个语句对应的第二分类标注信息;将句向量序列集合输入已训练好的深度学习分类模型,确定出目标语料中每个语句对应的第三分类标注信息;基于目标语料中每个语句对应的第一分类标注信息、第二分类标注信息和第三分类标志信息,确定每个语句对应的失效模式信息。
在一种可选的实施例中,第一分类标注信息集合包括汽车的结构信息和/或汽车的系统信息,第二分类标注信息集合包括汽车的性能评价指标信息,第三分类标注信息集合包括汽车的场景信息。
在一种可选的实施例中,已训练好的深度学习分类模型是已训练好的Bert分类模型。
在一种可选的实施例中,根据目标语料确定分类标签信息集合,包括:基于特征提取网络,提取目标语料中的关键特征信息;对关键特征信息进行筛选与分类,确定分类标注信息集合。
在一种可选的实施例中,在根据目标语料确定分类标注信息集合之前,该方法还包括:获取原始语料;对原始语料进行预处理,得到目标语料;预处理包括提取有用信息、分词、去停用词、断句、结构化中的至少一个。
在一种可选的实施例中,分类标注信息集合还包括第四分类标注信息集合,第四分类标注信息集合包括情感倾向特征信息;在将句向量序列集合输入已训练好的深度学习分类模型,确定出目标语料中每个语句对应的第三分类标注信息之后,该方法还包括:将词向量序列集合输入已训练好的深度学习情感分类模型,确定出目标语料中每个语句对应的第四分类标注信息。
相应地,本公开实施例提供了一种基于语料的分类装置,该装置包括:
标注模块,用于根据目标语料确定分类标注信息集合;分类标注信息集合包括第一分类标注信息集合、第二分类标注信息集合和第三分类标注信息集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中汽创智科技有限公司,未经中汽创智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110776249.1/2.html,转载请声明来源钻瓜专利网。