[发明专利]一种基于卷积自编码器的空间位置信息的表征学习方法在审

专利信息
申请号: 202111467616.6 申请日: 2021-12-02
公开(公告)号: CN114443788A 公开(公告)日: 2022-05-06
发明(设计)人: 徐烨;汤敏伟;李真 申请(专利权)人: 天翼电子商务有限公司
主分类号: G06F16/29 分类号: G06F16/29;G06F16/2458;G06F16/21;G06F16/835;G06N3/04;G06N3/08;G06Q40/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 102200 北京市昌平*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 编码器 空间 位置 信息 表征 学习方法
【说明书】:

发明公开了一种基于卷积自编码器的空间位置信息的表征学习方法,包括以下:S1.数据获取与数据预处理,获取待研究的数据,所述数据为表格类型的数据,需要包含数据唯一标识符、时间戳信息、经纬度信息以及附加的业务特征信息N个,对于所获取的N个业务特征,进行归一化处理。本发明基于地理位置信息,通过引入相关的空间数据处理方法以及卷积自编码器,能够更好的表征地理位置上的近邻关系,且通过编码器加工的结果,能够更好的与机器学习的建模方法进行整合,扩展了原有的规则衍生方法和思路,亦对后续涉及到地理位置的数据建模研究具有重要的理论、实践意义和推广应用价值。

技术领域

本发明涉及新兴信息技术领域,特别涉及地理位置的业务场景,用来学习在地理位置上的近邻关系表征,具体涉及到卷积自编码建模、空间数据的处理方法。

背景技术

随着机器学习、深度学习相关方向的研究和发展,人们发现各类建模方法的效果依赖于数据的表征,在经典机器学习领域,会强调数据缺失值、异常值等预处理步骤,而在图像领域,也往往会将图片进行翻转、裁剪、降噪等操作。目前,有部分学者致力于研究如何将数据更好的进行表征,尤其是图像、语音、文本等非结构化数据,以期望提高建模的效果。

而空间位置信息作为一种典型的半结构化数据,可以描述位置距离接近的事物是否具有同质性,对于很多领域的数据分析都有着有着广泛的运用,如:降雨防汛、污染识别、土壤质地等领域。但空间分析的量化结果很容易出现一些异常值,且存在一定的空间尺度效应和主观量化性,很难对在空间位置上的一些同质性、异构性进行表征,较难应用于机器学习的建模过程中。

发明内容

本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于卷积自编码器的空间位置信息的表征学习方法,本发明的目的在于解决现有技术中,空间分析的结果在机器学习建模过程较难结合应用,且没有有效的利用地理位置上的空间关系的问题,通过卷积自编码器的方法,能够有效的学习地理位置上的空间近邻分布的表征值,对涉及地理位置的数据研究/建模工作起到一个扩充式、启发式的作用。

本发明提供了如下的技术方案:

本发明提供一种基于卷积自编码器的空间位置信息的表征学习方法,包括以下:

S1.数据获取与数据预处理,获取待研究的数据,所述数据为表格类型的数据,需要包含数据唯一标识符、时间戳信息、经纬度信息以及附加的业务特征信息N个,对于所获取的N个业务特征,进行归一化处理;

S2.数据栅格化处理,按照样本的经纬度信息,将样本数据处理为点要素的矢量数据vec;同时,结合固定大小的滑动时间窗口和缓冲区,将样本所对应的近邻样本的矢量数据转换为栅格数据,具体包括描述近邻样本空间位置分布的栅格数据集raster_dist与描述近邻样本业务特征值分布的栅格数据集raster_feature;

S3.空间分析,对于步骤S2中所获取的矢量数据vec,基于标准差椭圆和凸包,生成对应的栅格数据集raster_ellipse与raster_convex,作为对近邻样本空间分布特征的补充信息;

S4.训练卷积自编码器,组合步骤S3中所获得的栅格数据集raster_dist、raster_ellipse、raster_convex、raster_feature,作为自编码器的输入,按照特定的训练参数构建卷积自编码器,并进行自编码器的训练;

S5.提取表征学习的结果,基于S4步骤所获得的自编码器模型,提取出其中的编码器部分作为表征加工的凭据,编码器所计算出的数值即为模型自动加工的特征值。

作为本发明的一种优选技术方案,步骤S1中,对于所获取的N个业务特征,进行归一化处理,具体做法为:采取z-score方法,分别对各个特征进行标准化的处理,去除量纲的影响。

作为本发明的一种优选技术方案,步骤S2中的具体步骤描述如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111467616.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top