[发明专利]模型训练及数据分析方法、装置、设备以及存储介质有效
申请号: | 201810022981.8 | 申请日: | 2018-01-10 |
公开(公告)号: | CN110020714B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 谢志辉;盖永波;赵钰;王骏 | 申请(专利权)人: | 斑马智行网络(香港)有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06F18/214 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 中国香港九龙长沙湾道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 数据 分析 方法 装置 设备 以及 存储 介质 | ||
本公开提供了一种针对时序数据的模型训练及数据分析方法、装置、设备以及存储介质。构造训练样本,训练样本包括一个或多个时序数据,不同的时序数据对应于不同的特征维度,每个时序数据分别包括多个按时间顺序排列的数据;使用一个或多个训练样本训练时序数据分析模型,时序数据分析模型用于对包括一个或多个时序数据的样本所属的类别进行分析。由此,利用训练好的模型可以实现对时序数据的自动判读。
技术领域
本公开涉及数据分析领域,特别是涉及针对时序数据的模型训练及数据分析方法、装置、设备以及存储介质。
背景技术
针对诸多领域中的时序数据,目前大多是由行业内经验丰富的专家通过人工判读的方式对生成的时序数据进行分析,以确定时序数据所属的类别。这种人工判断方式对人力资源要求较高,且不能实现对大规模时序数据的快速判断。
例如,在石油领域里,测井资料可以提供地下油层分部结构和沉积特性的大量信息。测井数据是以等距方式采集一组物理量的数据,并以关系模式形式记录,常常用一组曲线形式直观显示,称为测井曲线,测井曲线是一种地质岩石物理特性随深度变化的响应信号。因此,测井数据也可以视为一种时序数据。而目前对这些测量数据的判断,完全是依赖于技术人员的人工判断,只是将信息传递过程做了优化,成立了集中的分发中心,但限于人力有限,无法规模化应用,而且整个流程耗时耗力,无法快速实现对大规模时序数据的判读。
因此,需要一种能够对时序数据进行自动分析的数据分析方案。
发明内容
本公开的主要目的在于提供一种能够无需依赖人力即可自动实现对时序数据的分析的模型训练及数据分析方法、装置、设备以及存储介质。
根据本公开的第一个方面,提供了一种模型训练方法,包括:构造训练样本,训练样本包括一个或多个时序数据,不同的时序数据对应于不同的特征维度,每个时序数据分别包括多个按时间顺序排列的数据;使用一个或多个训练样本训练时序数据分析模型,时序数据分析模型用于对包括一个或多个时序数据的样本所属的类别进行分析。
优选地,训练样本还包括一个或多个时序数据所对应的标记,标记用于标记训练样本所属的类别。
优选地,一个或多个时序数据是下述信息中的一项:用户的一项或多项身体指标;一项或多项油气探测指标;一项或多项光伏切片制造工艺参数;一项或多项风能机组性能参数;一项或多项环保设备监测参数;一项或多项交通运输数据;一项或多项空港生产参数。
优选地,一个或多个时序数据可以包括以下一项或多项身体指标:心率数据曲线;脑电图;呼吸仪成像;血压数据曲线。
优选地,不同的时序数据对应于不同的油气探测指标,每个时序数据包括多个以等距方式先后采集的对应不同地表深度的地质测量数据,并且一个或多个时序数据可以包括以下一项或多项油气探测指标:电阻率;孔隙率;渗透率;伽马能谱质量密度;声波速度;中子孔隙度;光谱噪声。
优选地,时序数据分析模型是特定结构的卷积神经网络模型。
优选地,卷积神经网络模型包括位于卷积层和激活函数层之间的批标准化层,批标准化层用于对卷积层输出的数据分批次地进行随机梯度下降训练,对每批下降训练后的数据进行归一化处理,并将归一化处理后的数据输入激活函数层。
优选地,卷积神经网络模型还包括预定层数的特征提取层,每层特征提取层包括依次连接的卷积层、批标准化层、激活函数层、网络节点丢弃层、卷积层以及最大池化层。
优选地,构造训练样本的步骤可以包括:在一个类别的训练样本的数量低于第三预定阈值的情况下,基于该类别的训练样本的时序数据,构造新的时序数据,以得到属于该类别的新的训练样本。
优选地,使用上采样的方式构造新的时序数据;或者使用SMOTE算法构造新的时序数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斑马智行网络(香港)有限公司,未经斑马智行网络(香港)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810022981.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置