[发明专利]一种对房型进行分类的方法、装置、介质及电子设备在审

专利信息
申请号: 202211022469.6 申请日: 2022-08-25
公开(公告)号: CN115358230A 公开(公告)日: 2022-11-18
发明(设计)人: 郜文彬 申请(专利权)人: 北京分贝通科技有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06K9/62
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 刘广
地址: 100000 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 进行 分类 方法 装置 介质 电子设备
【说明书】:

本申请实施例提供一种对房型进行分类的方法、装置、介质及电子设备,所述方法包括:获取至少一个供应商中的房型数据;对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量得到特征向量集合;将所述特征向量集合输入随机森林分类器中,得到初始分类结果;根据所述初始分类结果构建无向图,采用深度优先遍历算法对所述无向图进行连通性分析得到至少一个连通子图,与所述至少一个连通子图中各连通子图对应的一个或多个房型确认为属于一类房型。本申请一些实施例提出的方案能很好地提升房型聚合效果,降低用户在酒店预订等场合可选的房型个数。

技术领域

本申请涉及数据处理领域,具体而言本申请实施例涉及一种对房型进行分类的方法、装置、介质及电子设备。

背景技术

酒店模块的酒店详情页面房型数量多,从供应商获取到的所有房型,经过简单聚合逻辑后,全部展示。目前用户酒店详情页面看到的房型个数,行业内OTA均值为14个房型,用户选购体验不好。

房型聚合关系为进入酒店详情(D)时,根据房型名称/窗/床简单判断逻辑,实时聚合。聚合关系不能积累沉淀,酒店聚合算法采用预制的正则表达式方案,聚合率低,而且不具备数据迭代,历史的正向的聚合结果,并不会改善后续的聚合结论。

现有的利用正则表达式方案,以房型名称/窗/床三个维度进行简单判断的聚合方式,对数据本身的质量要求比较高,当面对房型名称、窗型和床型有微小的表达方式不一的时候,就会出现聚合不到一起的情况,而业务的不断发展接入的供应商会不断增多,整个数据的差异性会更为普遍,聚合的效果会越来越差。

因此如何提升在酒店详情页等展示页面的房型聚合结果成了亟待解决的技术问题。

发明内容

本申请实施例的目的在于一种对房型进行分类的方法、装置、介质及电子设备,本申请一些实施例提出的方案能很好地提升房型聚合效果,降低用户在酒店预订等场合可选的房型个数,提升用户选购体验,并且在房型聚合优化后,提升酒店报价锚定率(锚定价的价格计划数/酒店详情的总价格计划数)。

第一方面,本申请实施例提供一种对房型进行分类的方法,所述方法包括:获取至少一个供应商中的房型数据;对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量得到特征向量集合;将所述特征向量集合输入随机森林分类器中,得到初始分类结果;根据所述初始分类结果构建无向图,采用深度优先遍历算法对所述无向图进行连通性分析得到至少一个连通子图,与所述至少一个连通子图中各连通子图对应的一个或多个房型确认为属于一类房型。

本申请的一些实施例通过随机森林分类器获取对房型的初始分类结果,之后再根据构建的无向图确定属于同一类型的各房型,实现房型的自动分类。

在一些实施例中,所述获取至少一个供应商的房型数据,包括:获取基础房型数据,并通过所述供应商提供的接口获取供应商房型列表,得到所述房型数据。

本申请的一些实施例的待分析的房型数据包括基础房型数据和供应商房型列表。

在一些实施例中,所述对所述房型数据进行分词得到分词结果,并根据所述分词结果构建特征向量,包括:基于多种分词类别对所述房型数据进行分词处理,得到分词结果,其中,所述分词类别至少包括:酒店房型名称、楼层、床型,面积、服务、设施和发票;根据所述分词结果和余弦相似度算法构建所述特征向量,得到特征向量集合。

本申请的额一些实施例根据酒店房型数据、楼层、床型、面积、服务、设施以及发票实现对房型数据的分词处理,以使得到的特征向量更好反应被分析房型的特征,更好的实现房型分类。

在一些实施例中,所述将所述特征向量集合输入随机森林分类器中,得到初始分类结果,包括:将所述特征向量集合输入所述分类器,得到两两房型属于同一房型的得分。

本申请的一些实施例通过随机森林分类器获取判决两个房型属于属于同一类房型的得分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京分贝通科技有限公司,未经北京分贝通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211022469.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top