[发明专利]一种线路类旅游产品的实时比价方法在审
| 申请号: | 201510782725.5 | 申请日: | 2015-11-16 |
| 公开(公告)号: | CN105354770A | 公开(公告)日: | 2016-02-24 |
| 发明(设计)人: | 苏永圳;孟硕培;史何富 | 申请(专利权)人: | 南京途牛科技有限公司 |
| 主分类号: | G06Q50/14 | 分类号: | G06Q50/14 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
| 地址: | 210042 江苏省南京*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种线路类旅游产品的自动实时比价方法,从线路行程信息,价格信息,团期信息等多个维度对线路类旅游产品进行相似度计算,获得相似线路产品,并实时抓取最新价格,保证比价的准确性和实时性。本发明包括获取线路产品信息步骤,相似度计算步骤,实时获取价格步骤。本发明针对线路类旅游产品从多种维度进行相似性比对,比对结果精确,能够筛选出相似度极高的线路产品;且能够根据各线路产品的更新周期差异,动态调整抓取频率,在保证实时抓取产品的最新价格进行比价的基础上充分节约服务器和网络资源。 | ||
| 搜索关键词: | 一种 线路 旅游 产品 实时 比价 方法 | ||
【主权项】:
一种线路类旅游产品的实时比价方法,其特征在于,包括如下步骤:步骤A,获取旅游网站上的线路产品并从中抽取旅游相关数据,所述旅游相关数据至少包括出发地、目的地、行程信息、团期信息、价格信息、交通信息中的一种或几种的组合;步骤B,筛选出相同出发地,相同目的地,相同出游天数的旅游线路产品作为候选的相似产品,计算行程相似度、团期相似度和价格相似度,并通过以下公式计算两个旅游产品的总和相似度:行程相似度*行程权重+团期相似度*团期权重+价格相似度*价格权重;所述行程相似度通过以下步骤进行计算:将候选相似线路产品的行程信息作为输入文本,对文本进行分词后对词语进行词性标注,将行程中出现的地名的名词提取出来,利用名词和其词频组成该线路产品的特征向量,采用以下公式计算行程相似度:
其中,Ai,Bi为线路产品的特征向量;所述团期相似度= A∩B / A∪B,其中A和B分别为两条线路所有团期的集合;所述价格相似度根据根据下式进行计算:price = 1‑(abs(averageA ‑ averageB)/averageA + abs(averageA‑averageB)/averageB)/2其中averageA和averageB分别为线路A和线路B的平均价格;通过以下公式计算总和相似度:总和相似度=行程相似度*行程权重+团期相似度*团期权重+价格相似度*价格权重,当总和相似度达到或超过设定好的比对阈值时,则认为这些产品是相同的;步骤C,将步骤B中已经完成匹配的相同产品列表中的各线路产品链接放置在全量抓取队列中,采用爬虫系统持续依次抓取全量队列中各线路产品链接的价格信息,并计算各个线路产品的更新周期;定时进行周期性抓取,当周期性抓取时间达到线路产品更新周期的整数倍时,则获取这些线路产品链接中的价格信息并存入缓存中;当用户请求比价时,判断缓存是否存在未过期的价格信息,当存在未过期的价格信息时从缓存中获得页面产品列表中各个产品对应的价格,否则实时获取价格数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京途牛科技有限公司,未经南京途牛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510782725.5/,转载请声明来源钻瓜专利网。
- 上一篇:低电源电压灵敏度的基准偏置
- 下一篇:陶瓷产品表面缺陷激光相干检测装置





