[发明专利]一种基于Flink的探地雷达数据SVD分布式算法在审

专利信息
申请号: 202110424202.9 申请日: 2021-04-20
公开(公告)号: CN113030954A 公开(公告)日: 2021-06-25
发明(设计)人: 冯晅;邢慧婷;王研博;宋超 申请(专利权)人: 吉林大学
主分类号: G01S13/88 分类号: G01S13/88;G01S7/41;G06F16/182
代理公司: 沈阳维特专利商标事务所(普通合伙) 21229 代理人: 甄玉荃
地址: 130012 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 flink 雷达 数据 svd 分布式 算法
【权利要求书】:

1.一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,包括如下步骤:

1)采集数据,使用Flume数据采集框架,读取原始雷达数据文件,按照文件头中的元数据来切分数据道,记录在文本文件中;

2)收集文本文件,随后用HDFS存储数据,将数据以分块的方式分布式存储在集群的不同节点中;

3)在Flink计算框架中对数据进行分布式计算,首先从HDFS中读取数据,将步骤1)中的每行数据解析为原始矩阵Am×n,通过公式A=U∑VT进行SVD分解,得到三个矩阵U、E、V,具体计算方法如下:

U是A的左奇异向量组,是A*AT的m个特征向量的标准正交基,称为A*AT的酉矩阵,V是A的右奇异向量组,是AT*A的n个特征向量的标准正交基,称为AT*A的酉矩阵,Em×n中主对角线的值由A*AT的非零特征值得到,最终对A进行SVD分解就转换成为求解A*AT和AT*A的特征值和特征向量,最后得到三个矩阵U、E、V,通过SVD分解可以将存储矩阵A转换成存储矩阵U、E、V,极大的减少数据的存储量;

4)建立大数据框架,首先建立大数据集群,集群一共7台机器,其中4台为Hadoop集群,1台namenode,3台datanode,3台为Flume集群,4台为Flink集群,Fink集群与Hadoop集群共用,1台JobManager,3台TaskManager,大数据计算框架Flink在SVD分解的过程中,提供了分布式计算的物理节点和数据分发策略,最后利用HDFS进行分布式存储,将U、E、V分布式的存储在集群不同的节点上。

2.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤1)中,在切分后的每一条数据尾部增加“\n”分隔符。

3.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤2)中,使用textCollector将步骤1)中的数据源统一进行收集。

4.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤3)计算SVD的过程中,将矩阵分成子矩阵块,按照计算规则分布式的分发到集群的不同节点,通过Map算子进行子矩阵块的基本运算以及初等行变换,计算之后再根据特征值进行排序,提取前n个非零的特征值,剩下的置为零,对子矩阵块进行聚合,将矩阵复原,将结果数据存储到HDFS中,既可以减小数据规模,又可以对数据去噪。

5.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤3)中,所述U矩阵中向量为正交,称为左奇异向量,Σ矩阵除了对角线的元素都是0,对角线上的元素称为奇异值,VT矩阵的向量为正交,V里面的向量称为右奇异向量。

6.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤3)中,特征值的计算方法如下:

计算A和AT的相乘,得到矩阵Mm×m,根据|M-λE|=0,求解M的特征多项式的值,采用可编程实现的GAUSS消元法来实现,从第一行开始进行迭代计算,每次消元涉及到相邻的两行数据,最后得到上三角行列式,特征多项式的值就是主对角线值的乘积,进而求得λ,通过公式求得Em×n的主对角线值。

7.根据权利要求1所述的一种基于Flink的探地雷达数据SVD分布式算法,其特征在于,所述步骤3)中,特征向量的计算方法如下:

首先选取非零特征值,通过公式(M-λE)x=0进一步求得特征向量,对特征向量进行标准化,得到A*AT的酉矩阵U,同理也可以求得AT*A的酉矩阵V。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110424202.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top