[发明专利]用于POI的相似度计算的方法、装置、设备和计算机可读存储介质有效
申请号: | 201710922431.7 | 申请日: | 2017-09-30 |
公开(公告)号: | CN107609185B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 谢红伟 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06N3/04;G06N3/08 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;屈小春 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 poi 相似 计算 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种用于地图兴趣点POI的相似度计算的方法,其特征在于,包括:
构建至少一条训练样本,所述一条训练样本中包括一对POI;
对所构建的至少一条训练样本进行序列化处理,其中所述序列化处理包括:利用one-hot编码用预设的one-hot编码字典将所述至少一条训练样本转换为序列;以及
将经序列化处理后的至少一条训练样本输入至LSTM神经网络模型,对所述LSTM神经网络模型进行训练;经过训练的该LSTM神经网络模型用于对一对POI的相似度进行计算;
根据训练的LSTM神经网络模型的网络参数对测试数据进行预测,并输出测试结果。
2.根据权利要求1所述的方法,其特征在于,
所述训练样本采用正样本和/或负样本,所述训练样本还包括样本类型的标识,
其中,所述正样本包括经人工标注的样本和/或线上高准挂接的样本;
所述负样本包括经人工标注的样本、父子关系样本、和/或检索返回的样本。
3.根据权利要求2所述的方法,其特征在于,在对所构建的至少一条训练样本进行序列化处理之前,所述方法还包括:
对所述至少一条训练样本进行均衡化处理。
4.根据权利要求3所述的方法,其特征在于,所述均衡化处理采用过采样或欠采样。
5.根据权利要求2所述的方法,其特征在于,所述构建至少一条训练样本,包括:
采用预设的正样本和负样本的比例来构建所述至少一条训练样本。
6.一种用于地图兴趣点POI的相似度计算的装置,其特征在于,包括:
构建单元,被配置为构建至少一条训练样本,所述一条训练样本中包括一对POI;
序列化单元,被配置为对所构建的至少一条训练样本进行序列化处理,其中所述序列化处理包括:利用one-hot编码用预设的one-hot编码字典将所述至少一条训练样本转换为序列;以及
模型训练单元,被配置为将经序列化处理后的至少一条训练样本输入至LSTM神经网络模型,对所述LSTM神经网络模型进行训练;经过训练的该LSTM神经网络模型用于对一对POI的相似度进行计算;
根据训练的LSTM神经网络模型的网络参数对测试数据进行预测,并输出测试结果。
7.根据权利要求6所述的装置,其特征在于,所述训练样本采用正样本和/或负样本,所述训练样本还包括样本类型的标识,其中,所述正样本包括经人工标注的样本和/或线上高准挂接的样本,所述负样本包括经人工标注的样本、父子关系样本、和/或检索返回的样本。
8.根据权利要求6所述的装置,其特征在于,还包括:
均衡化单元,被配置为对所述至少一条训练样本进行均衡化处理。
9.一种用于地图兴趣点POI的相似度计算的设备,其特征在于,包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710922431.7/1.html,转载请声明来源钻瓜专利网。