[发明专利]一种基于数据挖掘的道路运输安全风险实时评估方法在审
申请号: | 201911388959.6 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111144772A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 罗文慧;蔡凤田;夏鸿文;曾诚;吴初娜;孟兴凯;王雪然 | 申请(专利权)人: | 交通运输部公路科学研究所 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06Q50/30 |
代理公司: | 北京卓泽知识产权代理事务所(普通合伙) 11766 | 代理人: | 白海燕 |
地址: | 100088*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 挖掘 道路 运输 安全 风险 实时 评估 方法 | ||
1.一种基于数据挖掘的道路运输安全风险实时评估方法,其特征在于,安全风险评估值是基于如下模型计算的:
R=P·M (1)
R为安全风险评估值,P为风险源或事故发生的概率评价指数,M为风险源或事故可能造成的损害后果严重性评价指数,“·”表示乘积关系;
其中,对于P和M值的获取采取如下方法:
步骤1:构建基础道路运输安全风险源清单和/或事故状态清单;
步骤2:数据获取;
步骤3:数据预处理:首先对步骤2获取的数据清理、去停用词;然后添加步骤1构建的风险源清单和/或事故状态清单;然后进行文本分词;
步骤4:近义词替换:对步骤3得到的文本词条进行近义词识别,并按风险源清单中词条和/或事故状态清单中词条表述进行替换;
步骤5:风险源或事故的动态辨识:利用TF-IDF算法对步骤4得到的文本数据进行风险源和/或事故状态挖掘,计算文本中的TF值、IDF值以及TF-IDF值,提取TF-IDF值明显偏大,且TF值偏高、IDF值偏低的风险源和/或事故状态,加入到风险源清单和/或事故状态清单中予以更新;
其中,TF值即公式(1)中的M值;
步骤6:构建因果提示词清单和因果句子结构清单;
步骤7:“事故链”提取:将步骤4得到的文本进行句子切分,删除不含在步骤6因果提示词清单的句子,再输入步骤5得到的风险源清单和/或事故状态清单,迭代抽取句子中存在因果关系的风险源和/或事故状态;再根据步骤6的因果句子结构清单挖掘出道路运输安全风险“事故链”集I={I1,…,Ir,…,Is}(r=1,2,…,s),Ir表示第r条事故链,s表示事故链总数;
步骤8:风险源和/或事故状态相关性挖掘:通过Apriori算法对步骤7得到的事故链进行关联性挖掘,其中事故链中风险源Fi与事故状态Sj关联成立的置信度即为公式(1)中的P值,所述置信度值指在满足关联规则下,事故链中Fi发生的条件下,Sj出现的概率。
2.根据权利要求1的基于数据挖掘的道路运输安全风险实时评估方法,其特征在于,步骤3中,数据清理包括对获取的文本数据中部分缺失值进行去除处理,对重复文本进行单份保存处理;去停用词指的是去除不包含或包含极少语义的词。
3.根据权利要求1的基于数据挖掘的道路运输安全风险实时评估方法,其特征在于,步骤4中,近义词识别方法是:用改进的汉明距离计算步骤3得到的词条和风险源清单中风险源词条的相似度,设置相似度阈值,若两个词条相似度大于等于阈值,则认为两词为近义词;改进的汉明距离定义为:不同长度的字符串中相同字符的个数。
4.根据权利要求1的基于数据挖掘的道路运输安全风险实时评估方法,其特征在于,步骤5中,将某个数据文本d的总词数记为c(d),某个风险源Fi在该文本中出现的次数记为c(i),则风险源Fi在该段文本中的TF值为:
设采集全部文本总数为D,出现风险源Fi的文本总数为n,则风险源Fi的IDF值为:
TF-IDF值为:
(TF-IDF)i=TFi×IDFi (4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交通运输部公路科学研究所,未经交通运输部公路科学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911388959.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置