[发明专利]一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法在审
| 申请号: | 202010850491.4 | 申请日: | 2020-08-21 |
| 公开(公告)号: | CN111984707A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 刘朝;王东强;谢晶晶;孙英刚;欧燕林;夏扬;吴成军;申东阳;李国勇 | 申请(专利权)人: | 重庆大数据研究院有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06F40/216;G06F17/18;G06Q50/26 |
| 代理公司: | 重庆信航知识产权代理有限公司 50218 | 代理人: | 穆祥维 |
| 地址: | 401147 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 营运 车辆 模式 跨界大 数据 多层次 深度 融合 挖掘 方法 | ||
1.一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,包括如下步骤;
S1、收集车辆多模式跨界大数据的原始数据集;
S2、对收集到的所述原始数据集进行数据预处理;
S3、对预处理后的数据利用WEKA算法进行数据挖掘提取出特征关键字;
S4、通过TF-IDF技术计算出特征关键字权重和不同特征关键字之间的相似度,构建权重以获得样本;
S5、基于样本构建回归模型,并随之使用所构建的回归模型确定所有已知的第二类目标对象中的每个是否潜在地属于第一类目标对象;
S6、对构建回归模型后的数据进行融合;
S7、对融合后的数据进行分析模拟,体现交通流的真实状态,描述各种交通控制策略的实施过程。
2.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S1中,所述原始数据集包括车辆信息数据、城市交通管理数据、城市智能监管数据和城市道路管理数据。
3.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S2中,所述数据预处理包括对数据进行数据降维,所述数据降维的具体步骤为:对于维度小于3的数据利用t-SNE算法直接降维;对于维度大于等于3的高维大数据首先利用PCA算法进行第一次降维,使其降到2维,再对第一次降维后的数据采用t-SNE算法进行第二次降维。
4.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S3中,所述挖掘提取特征关键字的具体步骤为:加载预处理后的数据集;选择并设置C4.5算法;设置分类测试选项;构件和评估C4.5算法;进行多次分类后显示可视化决策树模型。
5.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S4中,所述计算出特征关键字权重和不同特征关键字之间的相似度的具体步骤为:加载挖掘提取的特征关键字;对关键字分别进行词频和逆文档频率;通过词频乘以逆文档频率的积计算出文档的每个数据的TF-IDF值;根据TF-IDF值对每个词进行降序排列。
6.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S5中,所述回归模型的构建的具体步骤为:在构建所述回归模型之前对每个样本中的每个字段执行规范化操作,包括处理缺失值、处理奇异值、对离散型的字符型字段进行重新编码、对每个样本中的每个字段进行规范化;在规范化操作执行完成之后进一步对每个样本中的每个字段执行离散化操作,包括对连续型的数据以划分区间的方式进行离散化、根据TF-IDF值曲线的趋势来判断区间划分结果的优劣。
7.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S6中,所述数据融合的具体步骤为:提取根据TF-IDF值降序排列中相似度高且权重大的数据;通过特征级融合方法融合这些数据。
8.根据权利要求1所述的一种营运车辆多模式跨界大数据的多层次深度融合挖掘方法,其特征在于,在所述步骤S7中,所述对数据进行分析模拟包括车辆个体模拟、交通控制策略模拟、交通状态模拟、交通管理模拟和交通组织模拟。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大数据研究院有限公司,未经重庆大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010850491.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信基站用具有防护功能的设备柜
- 下一篇:一种肺癌靶向药的高效制备方法





