[发明专利]构建乘客社交网络的方法有效
申请号: | 201410167418.1 | 申请日: | 2014-04-24 |
公开(公告)号: | CN104317789B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 陈思恩;夏木;廖雅哲 | 申请(专利权)人: | 科技谷(厦门)信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京金蓄专利代理有限公司11544 | 代理人: | 孙巍 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 乘客 社交 网络 方法 | ||
技术领域
本发明涉及社交网络关系构建技术,尤其涉及一种构建乘客社交网络的方法。
背景技术
中国的航空行业,经过20年的高速发展,航空公司积累了大量的乘客数据资源,航空产品的电子商务也从传统的纯机票销售,到现在的机票、酒店、租车、附加服务和旅游产品多元化结合的经营模式。随着航空市场的日益完善,航空公司及在线旅游提供商开始引入新的营销手段,构建和分析乘客社交网络成为日益重要的社会关系网络营销方法。
从功能上来说,目前比较盛行的基于纯粹的网络社交媒体的社交关系网络的构建方式,并不适用于航空行业。
同时从技术上而言,航空公司已累计TB级别的数据,利用传统的关系型数据库构建这样一个超过两亿节点,30亿条边的社交关系网络图谱,在性能上已不可接受。
发明内容
本发明的目的在于提供一种构建乘客社交网络的方法,利用航空公司现有海量的乘客数据,构建乘客社交关系网络。
本发明的技术方案是如下。
构建乘客社交网络的方法,包括下列步骤:
步骤A、建立统一的乘客信息档案
a.1、根据航空公司的乘客乘机记录,以乘客的有效证件号为唯一识别标示,建立系统唯一的乘客信息档案,存储在HBase的乘客档案表中。每一个乘客档案,将是最终形成的乘客社交网络的一个节点。
a.2、关联航空公司的其他系统的乘客信息,根据有效证件或其他可识别字段,识别其他系统的乘客,并统一形成单一客户视图,单一客户视图中的乘客有一个唯一的ID来识别客户。
其中,步骤A的详细实施步骤:
(1)在HBase中建立两组表,分别存储客户的主数据信息和身份识别信息。客户主数据信息中,保存了客户的唯一ID和主要人口属性记录;客户的身份识别信息包括证件/账号类型,有效证件号/账号(含手机、QQ、Email、身份证、会员卡号、微博、登录ID、登录Cookie等);
(2)提供一个API接口,传入客户的任意识别信息,通过有效信息匹配和Cookie匹配,找到对应客户,返回客户的主数据信息。
(3)后台提供客户的查询、管理和去重功能。
在后续步骤信息进入时,从本步骤需要取得客户的唯一ID。
步骤B、建立乘客事件信息记录
b.1、在HBase上,建立乘客事件信息的数据结构。
b.2、建立乘客事件的数据字典。
b.3、通过Hive建立事件信息表结构,和HBase的数据结构建立映射关系。
步骤C、通过Hive加载事件数据到hdfs事件记录缓冲区并建立表结构,事件数据包括:
①、乘客PNR记录中同一航班,同PNR乘客产生的同行关系。
②、会员乘客的里程积分受让数据。
③、乘客的公司登记记录。
④、其他相关乘客事件。
步骤C具体包括:、
加载事件数据到hdfs事件记录缓冲区中
c.1、从航空公司所保存的旅客PNR记录中,根据同一航班,同PNR旅客产生的同行关系,提取并加载到旅客事件信息记录缓冲区中。PNR同行事件是民航社交网络的重要数据来源。
c.2、从航空公司的旅客会员系统中,提取会员的里程积分受让数据,加载到旅客事件记录缓冲区。
c.3、从航空公司的旅客CRM系统中,获取旅客的公司登记记录,将信息加载到旅客事件信息记录中,作为“在某一个时间点是同事”的特殊事件。
c.4、抽取航空公司内部其他相关旅客事件,加载到事件记录缓冲区,系统不拒绝对构建社交关系网络有助力的数据信息。
c.5、上述信息使用Hive在hdfs中建立表结构。
步骤C中所述的ETL工具为Storm、Kafka、Flume、Kettle、Sqoop中的一种或几种。
步骤D、清洗数据,并将缓冲区中的事件记录,结合基础字典中的信息,加载为完整的事件数据到步骤B所建立的HBase事件记录表中。本步骤使用Hive、PIG、SQL进行数据的清洗、转化和加载工作。
步骤E、将乘客的档案信息转化为节点数据,存储在基于图的分布式数据库中,每一个乘客为一个节点,节点上存储的属性包括:乘客的身份信息、乘客的人口统计属性、乘客的出行信息、乘客的消费信息、乘客的会员信息、乘客的企业信息、乘客的网络社交媒体信息(可选)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技谷(厦门)信息技术有限公司,未经科技谷(厦门)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410167418.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:提供ID验证的血液检测
- 下一篇:具有热电装置的温度控制系统