[发明专利]兴趣点判重方法、装置、设备和存储介质有效
申请号: | 202010084328.1 | 申请日: | 2020-02-10 |
公开(公告)号: | CN113255398B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 沈潋;宋宽;谢红伟 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06V30/422 | 分类号: | G06V30/422;G06F40/263;G06V30/146 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 点判重 方法 装置 设备 存储 介质 | ||
本申请实施例公开了一种兴趣点判重方法、装置、设备和存储介质,涉及地图数据处理技术领域。具体实现方案为:根据至少两个兴趣点的候选语种名称,从候选语种中确定目标语种以及所述至少两个兴趣点的目标语种名称;基于所述目标语种的相似度计算模型,根据所述至少两个兴趣点的目标语种名称,确定所述至少两个兴趣点是否属于同一兴趣点。通过对待比较的多个兴趣点的名称进行所属语种的区分,综合确定兴趣点名称在不同语种下的相似度,提高相似度计算的准确率以及地图国际化数据中跨语种处理的泛化能力,为兴趣点判重提供了有效依据。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及地图数据处理技术领域,具体涉及一种兴趣点判重方法、装置、设备和存储介质。
背景技术
在处理海量的地图兴趣点情报数据时,需要判别不同的情报数据是否描述为同一个兴趣点。目前对于地图国际化数据,现有技术对于跨语言兴趣点判重的适用性较差,相似度计算的准确率较低。
发明内容
本申请实施例提供了一种兴趣点判重方法、装置、设备和存储介质,能够提高跨语言地图兴趣点判重的准确性。
第一方面,本申请实施例提供了一种兴趣点判重方法,包括:
根据至少两个兴趣点的候选语种名称,从候选语种中确定目标语种以及所述至少两个兴趣点的目标语种名称;
基于所述目标语种的相似度计算模型,根据所述至少两个兴趣点的目标语种名称,确定所述至少两个兴趣点是否属于同一兴趣点。
上述申请中的一个实施例具有如下优点或有益效果:通过对待比较的多个兴趣点的名称进行所属语种的区分,综合确定兴趣点名称在不同语种下的相似度,提高相似度计算的准确率以及地图国际化数据中跨语种处理的泛化能力,为兴趣点判重提供了有效依据。
可选的,所述根据至少两个兴趣点的候选语种名称,从候选语种中确定目标语种,包括:
对所述至少两个兴趣点的候选语种名称进行语种识别,确定所述候选语种名称所属的候选语种;
若所述至少两个兴趣点中包括相同候选语种的候选语种名称,则确定所述相同候选语种作为待比较的目标语种。
上述申请中的一个实施例具有如下优点或有益效果:通过对待比较的多个兴趣点的候选语种名称进行语种识别,有利于区分待比较的目标语种,为多语种下兴趣点名称的比较提供依据。
可选的,所述对所述至少两个兴趣点的候选语种名称进行语种识别,确定所述候选语种名称所属的候选语种,包括:
确定所述候选语种名称的统一码,以及所述统一码在统一码表中的编码区域;
根据所述统一码表中编码区域与语种之间的映射关系,将所述编码区域所属的语种,确定为所述候选语种名称所属的候选语种。
上述申请中的一个实施例具有如下优点或有益效果:通过对候选语种名称的统一码,借助于统一码表中编码区域与语种之间的映射关系,有利于快速对多个兴趣点的候选语种名称进行语种识别。
可选的,所述基于所述目标语种的相似度计算模型,根据所述至少两个兴趣点的目标语种名称,确定所述至少两个兴趣点是否属于同一兴趣点,包括:
基于所述目标语种的相似度计算模型,根据所述至少两个兴趣点的目标语种名称,确定所述目标语种下所述至少两个兴趣点之间的相似度;
根据不同目标语种下所述至少两个兴趣点之间的相似度,确定所述至少两个兴趣点之间的整体名称相似度;
根据所述至少两个兴趣点之间的整体名称相似度,确定所述至少两个兴趣点是否属于同一兴趣点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010084328.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能手持装置
- 下一篇:一种213nm激光器