[发明专利]用于挖掘搜索查询日志的数据仓库有效
申请号: | 201710473912.4 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107527103B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | B·拉都;R·A·阿库纳阿格斯特 | 申请(专利权)人: | 艾玛迪斯简易股份公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G06Q10/02;G06Q50/14 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李颖 |
地址: | 法国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 挖掘 搜索 查询 日志 数据仓库 | ||
1.一种数据仓库系统,包括:
一个或多个处理器;以及
存储器,耦合到所述一个或多个处理器,所述存储器存储包括查询日志记录的第一数据库的第一数据以及当由所述一个或多个处理器执行时使所述系统执行以下操作的指令:
接收多个搜索查询,每个搜索查询在接收时间被接收,并且定义出发时间和起点-目的地对;
对于每个搜索查询:
确定从所述搜索查询的接收时间到出发时间的直到出发为止的时间,以及
在与起点-目的地对相关联的查询日志记录中存储指示搜索查询的接收和距出发的时间的第二数据,
其中每个查询日志记录对于与所述查询日志记录相关联的起点-目的地对,指示空位数量以及与每个空位相关联的距出发的时间;
接收为相应的起点-目的地对提供针对时间段的统计数据的请求;
响应于接收到所述请求,从第一数据库检索一个或多个查询日志记录,所述一个或多个查询日志记录中的每一个查询日志记录与相应的起点-目的地对相关联,并且包括与定义落入所述时间段内的相应出发时间的搜索查询相关的数据;
从检索出的查询日志记录中的每一个查询日志记录提取第二数据;基于第二数据生成第一拾取曲线,第一拾取曲线描绘在所述时间段期间相对于距出发的时间、针对相应的起点-目的地对的搜索查询的强度,
其中所述系统跟踪并提供指示搜索查询的接收和距出发的时间的数据;以及
使用第一拾取曲线针对相应的起点-目的地对预测对空位的需求,
其中预测使用历史搜索查询数据而不是单独的历史预订数据来预计未来的需求。
2.如权利要求1所述的系统,其中所述指令还使所述系统:
定义包括多个字段的索引,每个字段对应于相应的起点-目的地对,每个字段定义与相应的起点-目的地对相关联的每个查询日志记录在第一数据库中的位置。
3.如权利要求1或2所述的系统,其中所述搜索查询是低票价搜索查询。
4.如权利要求1或2所述的系统,其中由所述一个或多个查询日志记录中的每一个查询日志记录定义的出发时间在接收到请求时已经过去。
5.如权利要求1或2所述的系统,其中所述时间段覆盖多个出发区间,并且所述指令使所述系统使用第一拾取曲线通过以下操作来针对相应的起点-目的地对预测对空位的需求:
向第二数据库查询第三数据,第三数据针对在所述时间段期间已经出发的相应的起点-目的地对定义对空位的多个预订;
使用第三数据生成第二拾取曲线,第二拾取曲线描绘在所述时间段期间相对于距出发的时间的预订数量;以及
生成作为第一拾取曲线和第二拾取曲线的加权平均的第三拾取曲线,
其中使用第三拾取曲线针对相应的起点-目的地对预测对空位的需求。
6.如权利要求5所述的系统,其中所述指令还使所述系统对于被所述时间段覆盖的至少一个出发区间:
确定针对相应的起点-目的地对的第四拾取曲线;
确定在第三拾取曲线和第四拾取曲线之间提供最佳拟合的权重因子;以及
使用具有提供最佳拟合的权重的第三拾取曲线对于未来的出发区间针对相应的起点-目的地对预测对空位的需求,
其中第四拾取曲线是目标拾取曲线。
7.如权利要求6所述的系统,其中所述指令还使所述系统对于每个未来的出发区间:
对于计划在所述未来的出发区间期间出发的相应的起点-目的地对,为由相应旅行方案满足的搜索查询确定部分拾取曲线;
确定与所述部分拾取曲线具有最佳拟合的第三拾取曲线;以及
使用与所述部分拾取曲线具有最佳拟合的第三拾取曲线,对于未来的出发区间针对相应的起点-目的地对预测对空位的需求。
8.如权利要求7所述的系统,其中每个出发区间覆盖一天,并且所述时间段覆盖一年。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾玛迪斯简易股份公司,未经艾玛迪斯简易股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710473912.4/1.html,转载请声明来源钻瓜专利网。