[发明专利]一种购票信息分析的方法及装置在审
申请号: | 201611198401.8 | 申请日: | 2016-12-22 |
公开(公告)号: | CN107527223A | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 赵忠信;曹文洁 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/26;G06N7/00 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 胡彬,邓猛烈 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 购票 信息 分析 方法 装置 | ||
1.一种购票信息分析的方法,其特征在于,所述方法包括:
从乘客的属性信息、出行目的分布、购票次数、车次类型分布、购票方式分布、始发站分布、终点站分布、结伴关系提取乘客的购票行为模式特征;
通过乘客隐藏状态向量表征乘客的购票行为模式,则每个乘客为一个乘客在高维空间中的一个点,若所述乘客的类型是未知的,则将对所述乘客的类别判定问题转化为对所述乘客隐藏状态向量的概率密度分布进行拟合学习的过程。
2.根据权利要求1所述的方法,其特征在于,所述乘客的属性信息包括对数据文件按照年龄进行统计得到乘客年龄分布信息;
所述出行目的分布包括根据从身份证信息中解析出的省份籍贯编号信息再结合始发站和终点站的行政区划代码判断籍贯编号与始发站、终点站的行政区划代码是否相等,将乘客根据出行目的划分为预设个数的类别,各类别之间不重复不遗漏的分布;其中,odh代表始发站终点站都与籍贯一致,在家乡省内短途出行;odo代表始发站和终点站一致,但是在家乡以外的省短途出行;o代表离开家乡去外省出行;d代表从外省回家;other代表其他情况;
所述购票次数包括改签次数、退票次数和有效购票次数,所述改签次数为购票记录中状态为3的记录的频数;所述退票次数为购票记录中状态为2的记录的频数;所述有效购票次数为购票记录中状态为5的记录的频数;
所述车次类型分布包括根据乘客有多条乘车记录得到不同车次类型的序列,分别计算各车次类型经济性、快捷性、舒适性的得分,再相加求和并除以乘车记录次数,各指标值得分为预设时间内所有乘车记录的相应指标的平均值的分布;
所述购票方式分布包括根据乘客有多条乘车记录得到不同购票方式的序列,分别计算各车次类型经济性、快捷性的得分,再相加求和并除以乘车记录次数,各指标值得分为预设时间内所有乘车记录的相应指标的平均值的分布;
所述始发站分布包括根据始发站的数目、最大似然概率、车站重要性系数和始发站分布的熵,所述始发站的数目为以乘客身份证号为键,聚合乘客所有的购票记录,在所有的购票记录中,出现不同的始发站的数量;所述最大似然概率为在每个乘客的购票记录中,出现次数最多的车站,概率用频数除以总共的购票次数来计算;所述车站重要性系数为每个车站的重要性系数用当天该车站的总发送人数除以所有车站的总发送人数来计算;所述始发站分布的熵为聚合单个乘客所有的购票记录,得到所有购票记录中始发站的集合,统计集合中不同的项的频数,并计算离散分布的熵;
所述终点站分布包括终点站的数目、最大似然概率、车站重要性系数和终点站分布的熵;所述终点站的数目为以乘客身份证号为键,聚合乘客所有的购票记录,在所有的购票记录中,出现不同的终点站的数量;所述最大似然概率为在每个乘客的购票记录中,出现次数最多的车站,概率用频数除以总共的购票次数来计算;所述车站重要性系数为每个车站的重要性系数用当天该车站的总预计到站人数除以所有车站的总预计到站人数来计算;所述终点站分布的熵为聚合单个乘客所有的购票记录,得到所有购票记录中终点站的集合,统计集合中不同的项的频数,并计算离散分布的熵。
3.根据权利要求1所述的方法,其特征在于,所述结伴关系包括在获取的一段时间间隔内的乘客购票流数据中,如果乘客A与乘客B同一天同一个始发站上车,去往同一个目的站,乘坐同一辆列车,在同一个车厢内,使用相同的购票方式在同一个车站的同一个窗口购票,且满足支持度和置信度的要求,则乘客A与乘客B具有的结伴关系。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述从乘客的属性信息、出行目的分布、购票次数、车次类型分布、购票方式分布、始发站分布、终点站分布、结伴关系提取乘客的购票行为模式特征,包括:
用一个向量表征一个乘客的隐藏状态,将离散的、定性的数据标识转化为连续的、定量的数据形式;
根据对预设时间间隔内的购票数据进行统计分析,用最大似然概率描述乘客最可能的购票方式,将定性的、标签性的数据转化为连续的、定量的数据形式;
通过聚合在所述预设时间间隔内的乘客所有乘车记录中的购票方式,计算购票方式分布的熵和不同购票方式的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611198401.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吸顶电风扇
- 下一篇:一种地铁隧道通风用风机
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置