[发明专利]基于特征和语义的景点信息匹配方法及装置在审

专利信息
申请号: 201710240811.2 申请日: 2017-04-13
公开(公告)号: CN108733665A 公开(公告)日: 2018-11-02
发明(设计)人: 江浩 申请(专利权)人: 艺龙网信息技术(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 王辉;阚梓瑄
地址: 100015 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 匹配 匹配对象 景点信息 语义 景点 基础特征 计算机可读存储介质 匹配准确率 电子设备 景点位置 匹配结果 匹配效率 匹配装置 预设
【说明书】:

本公开涉及一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备。所述的景点信息匹配方法包括:判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。本公开能有效降低人工匹配的成本,并提升匹配准确率和匹配效率。

技术领域

本公开涉及数据处理技术领域,具体涉及一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备。

背景技术

现有旅游网站上的旅游景点、酒店、饭店等产品通常都会接入多个渠道的产品来源,但是不同来源的同一产品的基础数据信息经常会有所差别。以旅游景点产品为例,各个供应商对接的景点和门票资源数据每天都会有新景点上线和资源售完等产品状态变化。由于实际的景点数量的变化并不频繁,所以各个供应商的景点数据会有大量重复,需要把不同供应商的同一景点信息识别出来,进行产品数据的匹配和整合。实际情况中同一景点各个供应商提供的基础数据基本都不一致或部分信息缺失,包括名称,地址等都有差别,给自动化大量数据情况下的景点的匹配工作带来了困难。

例如,同一景点北京故宫在供应商A叫“故宫”,供应商B叫“故宫博物院”,供应商C叫“北京故宫”;另一景点嘉兴南湖风景区在供应商A叫“南湖景区”,供应商B叫“南湖风景名胜区”且双方地址描述也不相同。目前全部景点数据平均在2.1w,每天都有数据变化需要重新匹配,全部靠人力分析每人1天最多匹配200个景点,每次需要20人/天左右的工作量且需要定期重复,成本很高。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开的第一方面,提供一种基于特征和语义的景点信息匹配方法,包括:

判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;

在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;

结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。

在本公开的一种示例性实施例中,所述结合所述待匹配景点名称与所述可匹配对象名称的匹配结果包括:

在判断所述待匹配景点名称与所述可匹配对象名称相匹配时,判断所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第一阈值;

在判断所述距离差小于所述第一阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。

在本公开的一种示例性实施例中,所述判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象包括:

获取待匹配景点列表中的一所述待匹配景点;

检测数据库中是否存在位于所述待匹配景点的预设范围内的所述可匹配对象,并将存在的所述可匹配对象生成一对象列表;

检测所述对象列表中的可匹配对象与所述待匹配景点的基础特征是否匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艺龙网信息技术(北京)有限公司,未经艺龙网信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710240811.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top