[发明专利]一种基于卷积自编码器的空间位置信息的表征学习方法在审
申请号: | 202111467616.6 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114443788A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 徐烨;汤敏伟;李真 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/2458;G06F16/21;G06F16/835;G06N3/04;G06N3/08;G06Q40/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 编码器 空间 位置 信息 表征 学习方法 | ||
本发明公开了一种基于卷积自编码器的空间位置信息的表征学习方法,包括以下:S1.数据获取与数据预处理,获取待研究的数据,所述数据为表格类型的数据,需要包含数据唯一标识符、时间戳信息、经纬度信息以及附加的业务特征信息N个,对于所获取的N个业务特征,进行归一化处理。本发明基于地理位置信息,通过引入相关的空间数据处理方法以及卷积自编码器,能够更好的表征地理位置上的近邻关系,且通过编码器加工的结果,能够更好的与机器学习的建模方法进行整合,扩展了原有的规则衍生方法和思路,亦对后续涉及到地理位置的数据建模研究具有重要的理论、实践意义和推广应用价值。
技术领域
本发明涉及新兴信息技术领域,特别涉及地理位置的业务场景,用来学习在地理位置上的近邻关系表征,具体涉及到卷积自编码建模、空间数据的处理方法。
背景技术
随着机器学习、深度学习相关方向的研究和发展,人们发现各类建模方法的效果依赖于数据的表征,在经典机器学习领域,会强调数据缺失值、异常值等预处理步骤,而在图像领域,也往往会将图片进行翻转、裁剪、降噪等操作。目前,有部分学者致力于研究如何将数据更好的进行表征,尤其是图像、语音、文本等非结构化数据,以期望提高建模的效果。
而空间位置信息作为一种典型的半结构化数据,可以描述位置距离接近的事物是否具有同质性,对于很多领域的数据分析都有着有着广泛的运用,如:降雨防汛、污染识别、土壤质地等领域。但空间分析的量化结果很容易出现一些异常值,且存在一定的空间尺度效应和主观量化性,很难对在空间位置上的一些同质性、异构性进行表征,较难应用于机器学习的建模过程中。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于卷积自编码器的空间位置信息的表征学习方法,本发明的目的在于解决现有技术中,空间分析的结果在机器学习建模过程较难结合应用,且没有有效的利用地理位置上的空间关系的问题,通过卷积自编码器的方法,能够有效的学习地理位置上的空间近邻分布的表征值,对涉及地理位置的数据研究/建模工作起到一个扩充式、启发式的作用。
本发明提供了如下的技术方案:
本发明提供一种基于卷积自编码器的空间位置信息的表征学习方法,包括以下:
S1.数据获取与数据预处理,获取待研究的数据,所述数据为表格类型的数据,需要包含数据唯一标识符、时间戳信息、经纬度信息以及附加的业务特征信息N个,对于所获取的N个业务特征,进行归一化处理;
S2.数据栅格化处理,按照样本的经纬度信息,将样本数据处理为点要素的矢量数据vec;同时,结合固定大小的滑动时间窗口和缓冲区,将样本所对应的近邻样本的矢量数据转换为栅格数据,具体包括描述近邻样本空间位置分布的栅格数据集raster_dist与描述近邻样本业务特征值分布的栅格数据集raster_feature;
S3.空间分析,对于步骤S2中所获取的矢量数据vec,基于标准差椭圆和凸包,生成对应的栅格数据集raster_ellipse与raster_convex,作为对近邻样本空间分布特征的补充信息;
S4.训练卷积自编码器,组合步骤S3中所获得的栅格数据集raster_dist、raster_ellipse、raster_convex、raster_feature,作为自编码器的输入,按照特定的训练参数构建卷积自编码器,并进行自编码器的训练;
S5.提取表征学习的结果,基于S4步骤所获得的自编码器模型,提取出其中的编码器部分作为表征加工的凭据,编码器所计算出的数值即为模型自动加工的特征值。
作为本发明的一种优选技术方案,步骤S1中,对于所获取的N个业务特征,进行归一化处理,具体做法为:采取z-score方法,分别对各个特征进行标准化的处理,去除量纲的影响。
作为本发明的一种优选技术方案,步骤S2中的具体步骤描述如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111467616.6/2.html,转载请声明来源钻瓜专利网。