[发明专利]一种自动化深度学习方法、装置及存储介质在审
申请号: | 202011526061.3 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112598058A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 陈海波;罗志鹏;牛康宁;李阁;张治广;王锦;潘春光 | 申请(专利权)人: | 深延科技(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
地址: | 100081 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动化 深度 学习方法 装置 存储 介质 | ||
1.一种自动化深度学习方法,其特征在于,获取数据并对数据类型分析并处理,包括:
对所述数据进行出分时间压缩处理,得到压缩后的数据;
对所述压缩后的数据进行如下步骤的集成学习;
所述的集成学习包括自适应步骤,基于数据类型对数据的处理进行自动模型选择或自适应参数设置;其中,确定数据是语音和文本数据,则选择自动模型;确定数据是图像、视频和/或表格数据,则使用自适应参数设置。
2.根据权利要求1所述的自动化深度学习方法,其特征在于,所述的图像和视频数据采用深度学习方法依次进行数据处理、深度学习模型训练与测试、结果融合得到处理后的图像和视频数据,其中,在所述模型训练与测试部分根据所述的模型训练后的验证集上结果进行早停然后测试。
3.根据权利要求1所述的自动化深度学习方法,其特征在于,所述的语音和文本数据则采用机器学习和深度学习结合的方法,所述的语音数据处理,包括数据处理步骤和模型处理步骤;文本数据处理采用AutoNLP框架得到处理后的文本数据,包括数据预处理、训练和验证数据生成;表格数据处理采用机器学习方法;模型处理包括模型选择、模型训练,模型预测和结果融合,得到处理后的表格数据。
4.根据权利要求3所述的自动化深度学习方法,其特征在于,所述的文本数据,采用AutoNLP框架,对所述文本数据处理包括自动清洗与序列化、自动特征工程、自动超参调优、自动模型融合以及自动模型选择。
5.根据权利要求2所述的自动化深度学习方法,其特征在于:所述的图像和视频数据根据需求采取对应的深度学习算法采用自适应参数训练得到深度学习模型,深度学习模型包括目标检测深度学习模型、实例分割深度学习模型;所述自适应参数包括输入图像大小、每个epoch的步长,以及开始验证和融合结果的epoch数。
6.根据权利要求1所述的自动化深度学习方法,其特征在于:所述的集成学习即对结果进行融合,融合方法包括对多个预测结果进行平均。
7.根据权利要求6所述的自动化深度学习方法,其特征在于:所述的融合方法,设定最新融合的结果个数,对其进行融合。
8.根据权利要求1所述的自动化深度学习方法,其特征在于:所述的图像和视频数据,采用小规模Fast AutoAugment对当前图像数据集搜索最合适的数据增强;用O表示操作,x表示输入的图像数据,有:
其中p为概率,λ是增幅。
9.根据权利要求8所述的自动化深度学习方法,其特征在于,所述的视频数据选择视频总帧数的1/n进行深度学习。
10.根据权利要求1所述的自动化深度学习方法,其特征在于,所述的语音数据包括数据处理步骤和模型处理步骤:
所述的数据处理步骤,在数据预处理中,提取MFCC特征和Mel spectrogram特征两种特征;Mel spectrogram特征用于逻辑回归模型,MFCC特征用于深度学习模型;
所述的模型处理步骤,在训练数据生成中,构建迭代器以迭代地加载数据;数据以逐渐增加的比例加载;
在训练过程中,依次选择逻辑回归、CNN模型、CNN+GRU模型三个模型;最后将对所有模型结果和每个模型结果进行融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深延科技(北京)有限公司,未经深延科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011526061.3/1.html,转载请声明来源钻瓜专利网。