[发明专利]用于语义检索的人工智能系统和方法有效
申请号: | 201811647685.3 | 申请日: | 2018-12-29 |
公开(公告)号: | CN110765368B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 余鹏;郑万吉;赵骥;陈欢;宋奇;马利 | 申请(专利权)人: | 滴图(北京)科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语义 检索 人工智能 系统 方法 | ||
本申请涉及语义检索的系统和方法。系统可以执行以下方法:从用户终端获取查询词;使用预先生成的模型将所述查询词变换为查询词向量;使用乘积量化算法,根据所述查询词向量,从检索库检索一组POI向量;以及响应于所述查询词,基于所述一组POI向量确定至少一个POI,用于向用户推荐。
技术领域
本申请一般涉及用于语义检索的人工智能系统和方法,更具体地说,涉及基于深度学习的用于语义检索的人工智能系统和方法。
背景技术
在线上到线下服务期间,当用户想要检索感兴趣的地点(point of interest,POI)时,用户可以将与位置有关的查询词输入到在用户终端设备上实现的线上线下服务应用的搜索框中。线上到线下系统可以基于输入的查询词的语义向用户推荐至少一个位置。至少一个推荐位置可以帮助用户快速找出用户想要检索的POI。在用于语义搜索的现有方法中,线上到线下系统可以解析查询词,并且遍历至少两个召回策略以为用户检索至少一个推荐位置。然而,现有方法的问题在于搜索策略复杂,导致搜索效率低和搜索成本高。因此,希望提供直接基于用户输入的查询词的用于语义检索的人工智能系统和方法,更具体地,根据深度学习算法检索POI。
发明内容
本申请的一个方面是介绍一种用于语义检索的系统,该系统可以包括至少一个包括一组指令的存储介质。该系统可以包括通信地连接到网络的数据交换端口。该系统还可以包括与存储介质通信的至少一个处理器。当执行该组指令时,该至少一个处理器可以执行以下操作。至少一个处理器可以经由数据交换端口从用户终端获得查询词。至少一个处理器可以使用预先生成的模型将查询词变换为查询词向量。所述至少一个处理器可以使用乘积量化算法基于查询词向量从检索库检索出一组POI向量。该至少一个处理器可以响应于所述查询词,基于该组POI向量确定至少一个POI,用于向用户推荐。
在一些实施例中,可以通过执行以下操作来基于检索词语义和POI之间的相关性来训练预先生成的模型:获得初始模型;获得至少两个历史检索词-POI对,其中至少两个历史检索词-POI对的每一个包含一个历史查询词和相应的历史POI;对于至少两个历史检索词-POI对的每一个,将至少一个历史查询词或相应的历史POI解析为一个或以上的片段,并基于解析为历史检索词-POI对生成一个或以上文本表达;并使用深度学习方法基于历史检索词-POI对的文本表达训练初始模型,以获得预先生成的模型。
在一些实施例中,预先生成的模型可包括深度POI语义模型(deep POI semanticmodel,DPSM)模型。
在一些实施例中,为了使用乘积量化算法基于查询词向量从检索库检索出该组POI向量,该至少一个处理器可以获得POI数据库中至少两个POI的索引;从查询词中获取至少一个目标位置;并基于索引、查询词向量和至少一个目标位置,从检索库中确定该组POI向量。该组POI向量可以与查询词相关。
在一些实施例中,为了获得POI数据库中至少两个POI的索引,至少一个处理器可以从POI数据库获得至少两个POI;使用预先生成的模型将至少两个POI变换为至少两个POI向量;并使用图形处理单元(GPU)基于至少两个POI向量,生成至少两个POI的索引。
在一些实施例中,为了基于该组POI向量确定至少一个POI,用于响应于查询词向用户推荐,该至少一个处理器可以基于该组POI向量生成标识符(ID)列表。ID列表可以包括一组ID,每个ID指向一个候选POI。所述至少一个处理器可以使用训练好的质检模型确定关于该组POI向量的一组候选POI的一组相似值,每个相似值指示相应的POI与查询词的相关等级。至少一个处理器可以对该组候选POI的该组相似值进行排序。至少一个处理器可以基于该组相似值的排序从该组候选POI中确定至少一个POI。
在一些实施例中,训练好的质检模型是梯度提升决策树(GBDT)模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于滴图(北京)科技有限公司,未经滴图(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811647685.3/2.html,转载请声明来源钻瓜专利网。