[发明专利]一种基于卷积自编码器的空间位置信息的表征学习方法在审
申请号: | 202111467616.6 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114443788A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 徐烨;汤敏伟;李真 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/2458;G06F16/21;G06F16/835;G06N3/04;G06N3/08;G06Q40/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 编码器 空间 位置 信息 表征 学习方法 | ||
1.一种基于卷积自编码器的空间位置信息的表征学习方法,其特征在于,包括以下:
S1.数据获取与数据预处理,获取待研究的数据,所述数据为表格类型的数据,需要包含数据唯一标识符、时间戳信息、经纬度信息以及附加的业务特征信息N个,对于所获取的N个业务特征,进行归一化处理;
S2.数据栅格化处理,按照样本的经纬度信息,将样本数据处理为点要素的矢量数据vec;同时,结合固定大小的滑动时间窗口和缓冲区,将样本所对应的近邻样本的矢量数据转换为栅格数据,具体包括描述近邻样本空间位置分布的栅格数据集raster_dist与描述近邻样本业务特征值分布的栅格数据集raster_feature;
S3.空间分析,对于步骤S2中所获取的矢量数据vec,基于标准差椭圆和凸包,生成对应的栅格数据集raster_ellipse与raster_convex,作为对近邻样本空间分布特征的补充信息;
S4.训练卷积自编码器,组合步骤S3中所获得的栅格数据集raster_dist、raster_ellipse、raster_convex、raster_feature,作为自编码器的输入,按照特定的训练参数构建卷积自编码器,并进行自编码器的训练;
S5.提取表征学习的结果,基于S4步骤所获得的自编码器模型,提取出其中的编码器部分作为表征加工的凭据,编码器所计算出的数值即为模型自动加工的特征值。
2.根据权利要求1所述的一种基于卷积自编码器的空间位置信息的表征学习方法,其特征在于,步骤S1中,对于所获取的N个业务特征,进行归一化处理,具体做法为:采取z-score方法,分别对各个特征进行标准化的处理,去除量纲的影响。
3.根据权利要求1所述的一种基于卷积自编码器的空间位置信息的表征学习方法,其特征在于,步骤S2中的具体步骤描述如下:
2.1)表格数据转换为矢量数据,按照OGC的simple features的标准,根据样本的经纬度信息,以WKT的形式将其表达为点要素(POINT)的地理实体,并在原有表格数据的基础上添加该标识,作为矢量数据vec;
2.2)根据时间窗口筛选近邻样本,设置时间窗口的大小,如近3小时,根据各个样本的时间戳进行对其余样本进行筛选,筛选出符合时间窗口条件的样本,视作为各个样本在时间上的近邻样本,同时将近邻样本也表达为点要素(MULTIPOINT)的地理实体,添加到矢量数据vec上;
2.3)根据空间距离筛选近邻样本,根据步骤2.2)中所获取的近邻样本,以及步骤2.1)中所处理的点要素信息,按照距离构建矩形的缓冲区,即缓冲区为的方形区域,筛选点要素位于方形区域中的样本,作为各个样本在时空层面上的近邻样本;
2.4)将近邻样本的信息转换为栅格数据,根据步骤2.3)获得近邻样本,对于某个样本,记为该样本的经度,为该样本的纬度,构造大小为的矩阵,由于缓冲区的大小为,故每个栅格的边长为,若样本的第个近邻样本的经纬度为与,则按照公式(1)来确认近邻样本在矩阵中的行列索引与,其中int是指舍弃小数位,只保留整数位的函数;
通过统计矩阵内各个索引的点要素的个数,作为样本的近邻样本空间分布的栅格数据表示raster_dist;而通过最大值、平均值等聚合方式,统计矩阵各个索引中点要素的特征指标,能够构建N个特征的栅格数据表示raster_feature。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111467616.6/1.html,转载请声明来源钻瓜专利网。