[发明专利]一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法在审
| 申请号: | 202010850491.4 | 申请日: | 2020-08-21 |
| 公开(公告)号: | CN111984707A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 刘朝;王东强;谢晶晶;孙英刚;欧燕林;夏扬;吴成军;申东阳;李国勇 | 申请(专利权)人: | 重庆大数据研究院有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06F40/216;G06F17/18;G06Q50/26 |
| 代理公司: | 重庆信航知识产权代理有限公司 50218 | 代理人: | 穆祥维 |
| 地址: | 401147 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 营运 车辆 模式 跨界大 数据 多层次 深度 融合 挖掘 方法 | ||
本发明公开了一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;S1、收集车辆多模式跨界大数据的原始数据集;S2、对收集到的所述原始数据集进行数据预处理;S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;S4、通过TF‑IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重和相似度矩阵;S5、基于样本构建回归模型。本发明通过t‑SNE降维、WEKA算法特征提取和TF‑IDF算法,针对高维数据采取先降维再提取特征的分析策略,不仅实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。
技术领域
本发明涉及大数据技术领域,尤其涉及一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法。
背景技术
随着大数据时代来临和国民经济的快速发展,机动车辆增长迅速,使得在对机动车行驶时的路况信息需要及时的进行掌握,以便确定城市交通的流畅性。
虽然基础应用系统已经达到了较高的技术和应用水平,但也存在着一些问题和不足:各应用系统只针对本系统的数据处理,局限于简单的统计,统计信息都有其局限性,出现“信息孤岛”现象,无法实现数据融合、信息共享,使得在车辆营运过程中,工作效率仍没有显著提高。
基于此,本发明提出一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其通过t-SNE降维、WEKA算法特征提取和TF-IDF算法,针对高维数据采取先降维再提取特征的分析策略,不仅实现了跨界大数据多层次深度融合挖掘的有效融合,解决了由数据类型复杂、数据特征众多的高维数据集造成的融合效率低下和工作效率没有显著提高的问题。
为了实现上述目的,本发明采用了如下技术方案:
本发明提出一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,包括如下步骤;
S1、收集车辆多模式跨界大数据的原始数据集;
S2、对收集到的所述原始数据集进行数据预处理;
S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;
S4、通过TF-IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重以获得样本;
S5、基于样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象;
S6、对构建回归模型后的数据进行融合;
S7、对融合后的数据进行分析模拟,体现交通流的真实状态,描述各种交通控制策略的实施过程。
优选地,在所述步骤S1中,所述原始数据集包括车辆信息数据、城市交通管理数据、城市智能监管数据和城市道路管理数据。
优选地,在所述步骤S2中,所述数据预处理包括对数据进行数据降维,所述数据降维的具体步骤为:对于维度小于3的数据利用t-SNE算法直接降维;对于维度大于等于3的高维大数据首先利用PCA算法进行第一次降维,使其降到2维,再对第一次降维后的数据采用t-SNE算法进行第二次降维。
优选地,在所述步骤S3中,所述挖掘提取特征关键字的具体步骤为:加载预处理后的数据集;选择并设置C4.5算法;设置分类测试选项;构件和评估C4.5算法;进行多次分类后显示可视化决策树模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大数据研究院有限公司,未经重庆大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010850491.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信基站用具有防护功能的设备柜
- 下一篇:一种肺癌靶向药的高效制备方法





