[发明专利]交通违法行为分析方法、系统、电子设备及存储介质在审
| 申请号: | 202011307958.7 | 申请日: | 2020-11-20 |
| 公开(公告)号: | CN112417084A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 许旺土;李传明;文琰杰;黄永燊;丁昌星 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06Q50/26;G06Q50/30 |
| 代理公司: | 北京华创智道知识产权代理事务所(普通合伙) 11888 | 代理人: | 彭随丽 |
| 地址: | 361005 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 交通 违法行为 分析 方法 系统 电子设备 存储 介质 | ||
1.一种交通违法行为分析方法,其特征在于,包括:
获取交通运输行业个人运营车辆的行政处罚信息,构建行政处罚信息数据库;
构建上下两层LDA模型,分别对所述行政处罚信息数据库中数据进行违法行为分类;
考评分析所述分类的合理性,获取违规行为分布特点。
2.根据权利要求1所述的交通违法行为分析方法,其特征在于,所述分类包括:采用网格搜索法确定各LDA模型对数据进行分类时的分类个数和通过各LDA模型确定各自的分类主题内容。
3.根据权利要求2所述的交通违法行为分析方法,其特征在于,所述考评分析所述分类的合理性为:根据各LDA模型中分类主题个数的情况设置分类评价指标,当分类主题为二分类时,采用查准率、召回率和准确率进行考评;当分类主题为多分类时,采用Kappa系数进行考评。
4.根据权利要求3所述的交通违法行为分析方法,其特征在于,所述两层LDA模型中的其中一层LDA模型对不同车种的违法行为进行分类,另一层LDA模型基于所述其中一层LDA模型在车种分类基础上进行违法行为分类。
5.根据权利要求4所述的交通违法行为分析方法,其特征在于,所述LDA模型采用狄利克雷分布法对数据进行违法行为的主题分类,所述狄利克雷分布公式为:
其中α为超参数,β(α)计算步骤如下:
其中,
上式中α和β均为超参数,x为随机变量,n为x数据样本数量,i和j表示数据库中文档和词汇的索引,Γ(αi)和Γ(αj)表示Gamma函数。
6.根据权利要求5所述的交通违法行为分析方法,其特征在于,分类的主题满足zij~Mult(θ),基于所述主题生成词分布:生成词语其中,zij为第i篇文档第j个词的主题,θ为主题,Mult为多项式分布函数,Dir为狄利克雷分布函数,β为超参数。
7.根据权利要求6所述的交通违法行为分析方法,其特征在于,遍历所述数据库中所有文档,结合指定次数的迭代,更新参数p(zk|di)和p(wj|zk),其中di为第i个文档,wj为第j个词汇,zk为第k个主题,p(zk|di)为在第i个文档的条件下出现第k个主题的概率,p(wj|zk)为在选定第z个主题的条件下出现第j个词的概率;
更新公式为:
p(di,wj)=p(di)*p(wj|di)
其中,p(di|wj)为第i个文档为第j个词的概率,p(wj|di)为在第i个文档的条件下出现第j个词的概率,其为可观测变量;k为主题的索引。
8.一种交通违法行为分析系统,其特征在于,包括:
行政处罚信息数据库模块,用于获取交通运输行业个人运营车辆的行政处罚信息,构建行政处罚信息数据库;
违法行为分类模块,用于构建上下两层LDA模型,分别对所述行政处罚信息数据库中数据进行违法行为分类;
考评分析模块,用于考评分析所述分类的合理性,获取违规行为分布特点。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器耦合连接的存储器;其中,
所述存储器存储有计算机程序,所述计算机程序能够被所述至少一个处理器执行,以实现权利要求1-8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序被执行时,能够实现权利要求1-9中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011307958.7/1.html,转载请声明来源钻瓜专利网。





