[发明专利]基于人工智能的分类方法、装置、设备及存储介质有效
申请号: | 202110779021.8 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113378993B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 康焱;刘洋 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/241;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 分类 方法 装置 设备 存储 介质 | ||
本申请提供了一种基于人工智能的分类方法、装置、设备及计算机可读存储介质;方法包括:将第一业务场景的第一样本集合和第二业务场景的第二样本集合分别根据样本属性特征进行分组处理,得到每个业务场景下的多个特征组和单体特征;将每个业务场景下的多个特征组进行交叉操作,得到多个交叉特征组;根据多个特征组和多个交叉特征组训练至少一个特征提取模型;根据第一业务场景下的单体特征和每个特征提取模型输出的第一样本特征表征训练类别预测模型,并继续训练至少一个特征提取模型;根据训练后的至少一个特征提取模型和训练后的类别预测模型,预测第二业务场景的待测样本的类别标签。通过本申请,能够在提高迁移学习效率的同时提高预测准确性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的分类方法、装置、设备及计算机可读存储介质。
背景技术
随着人工智能的快速发展,机器学习在大量标记的数据上进行监督式训练可以获得很好的性能和效果,然而大型的标记数据集在数量和应用领域方面均有限,且手动标记足量的训练数据往往需要高昂的代价。
但是,迁移能力强的深度学习模型缺乏可解释性,可解释性强的深度学习模型迁移能力不强,使得在迁移学习的过程中往往训练较长时间的深度学习模型反而无法达到目标性能,造成迁移学习的效率低下。对于如何在提高迁移学习效率的同时保证预测的准确性,相关技术尚无有效解决方案。
发明内容
本申请实施例提供一种基于人工智能的分类方法、装置及计算机可读存储介质,能够在提高迁移学习效率的同时达到目标性能。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的分类方法,包括:
将第一业务场景的第一样本集合和第二业务场景的第二样本集合分别根据样本属性特征进行分组处理,得到每个业务场景下的多个特征组和单体特征;
将每个业务场景下的多个特征组进行交叉操作,得到多个交叉特征组;
根据多个特征组和多个交叉特征组训练至少一个特征提取模型;
根据第一业务场景下的单体特征和每个特征提取模型输出的第一样本特征表征训练类别预测模型,并继续训练至少一个特征提取模型;
根据训练后的至少一个特征提取模型和训练后的类别预测模型,预测第二业务场景的待测样本的类别标签。
本申请实施例提供一种基于人工智能的分类装置,包括:
特征分组模块,用于将第一业务场景的第一样本集合和第二业务场景的第二样本集合分别根据样本属性特征进行分组处理,得到每个业务场景下的多个特征组和单体特征;
交叉模块,用于将每个业务场景下的多个特征组进行交叉操作,得到多个交叉特征组;
第一训练模块,用于根据多个特征组和多个交叉特征组训练至少一个特征提取模型;
第二训练模块,用于根据第一业务场景下的单体特征和每个特征提取模型输出的第一样本特征表征训练类别预测模型,并继续训练至少一个特征提取模型;
预测模块,用于根据训练后的至少一个特征提取模型和训练后的类别预测模型,预测第二业务场景的待测样本的类别标签
上述方案中,特征分组模块,还用于针对第一业务场景的第一样本集合中的每个样本执行以下处理:将每个样本中具有相同样本属性的多个单体特征进行分组处理,得到多个第一样本特征组,将每个样本中未被用于进行分组处理的单体特征作为第一样本单体特征;针对第二业务场景的第二样本集合中的每个样本执行以下处理:将每个样本具有相同样本属性的多个单体特征进行分组处理,得到多个第二样本特征组,将每个样本中未被用于进行分组处理的单体特征作为第二样本单体特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110779021.8/2.html,转载请声明来源钻瓜专利网。