[发明专利]搜索数据处理方法、装置及计算机存储介质在审

专利信息
申请号: 202110185536.5 申请日: 2021-02-10
公开(公告)号: CN114911984A 公开(公告)日: 2022-08-16
发明(设计)人: 张高伟;赵德祥;崔健;宋健;任开 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/903 分类号: G06F16/903;G06F16/9532;G06F16/9537;G06F40/232;G06F40/30
代理公司: 北京合智同创知识产权代理有限公司 11545 代理人: 李杰;兰淑铎
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索 数据处理 方法 装置 计算机 存储 介质
【说明书】:

本申请实施例提供了搜索数据处理方法、装置及计算机存储介质。根据本申请实施例提供的方案,预先建立了资源池和用于指示纠错候选词的多模态特征,当对象输入了错误搜索词时,可以首先从多方面召回纠错候选词,进而采用排序模型基于多模态特征对召回的纠错候选词进行打分排序,根据排序打分结果来确定纠错结果。

技术领域

本申请实施例涉及搜索技术领域,尤其涉及搜索数据处理方法、装置及计算机存储介质。

背景技术

在搜索场景中,对象经常会出现输入的搜索词拼写错误的情况,如果直接用错误的搜索词进行检索,往往不会得到正确对象的结果。为此,目前的搜索场景中多通过自动纠错功能,对拼写错误的搜索词进行纠错,以提升搜索的准确率,提升对象搜索场景的使用体验对象。例如,对象使用地图应用软件搜索兴趣点的场景中,对象可能输入错误的搜索词,这种情况下,应用软件能够自动对搜索词进行纠错,并提供正确的搜索词给对象进行选择或者基于纠错后的搜索词,提供正确的搜索结果,以大大提升对象的搜索使用体验。

目前,对对象输入的搜索词进行纠错时,多基于不同的规则进行召回和排序,以获得最终的纠错结果。该过程中,召回和排序通过紧耦合共同发挥作用,不同的召回规则对应着不同的排序规则,导致纠错实现复杂,成本高,且纠错结果也不够准确。基于此,需要提供一种低成本、高效且准确的纠错方案。

发明内容

有鉴于此,本申请实施例提供一种搜索数据处理方案,以至少部分解决上述问题。

根据本申请实施例的第一方面,提供了一种搜索数据处理方法,包括:召回错误搜索词对应的纠错候选词;确定所述纠错候选词的多模态特征,其中,所述多模态特征包括一个以上用于表征所述纠错候选词的属性的属性特征和/或所述纠错候选词的搜索历史的搜索特征;根据纠错候选词的多模态特征,采用已训练的排序模型对所述纠错候选词进行排序打分,根据排序打分结果确定所述错误搜索词对应的纠错结果。

根据本申请实施例的第二方面,提供了另一种搜索数据处理方法,包括:接收对象的查询请求;对所述查询请求中错误的地理搜索关键词进行纠错处理,获得正确地理搜索关键词,其中,所述纠错数据处理为权利要求1-10中任一项搜索数据处理方法所述的数据处理;根据所述正确地理搜索关键词,对所述查询请求进行处理,获得查询结果。

根据本申请实施例的第三方面,提供了一种搜索数据处理装置,包括:纠错候选确定模块,召回错误搜索词对应的纠错候选词;特征确定模块,确定所述纠错候选词的多模态特征,其中,所述多模态特征包括一个以上用于表征所述纠错候选词的属性的属性特征和/或所述纠错候选词的搜索历史的搜索特征;纠错模块,根据纠错候选词的多模态特征,采用已训练的排序模型对所述纠错候选词进行排序打分,根据排序打分结果确定所述错误搜索词对应的纠错结果。

根据本申请实施例的第四方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的搜索数据处理方法对应的操作。

根据本申请实施例的第五方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的搜索数据处理方法。

根据本申请实施例提供的方案,预先建立了资源池和用于指示纠错候选词的多模态特征,当对象输入了错误搜索词时,可以首先从多方面召回纠错候选词,进而采用排序模型基于多模态特征对召回的纠错候选词进行打分排序,根据排序打分结果来确定纠错结果。由此,无需针对不同召回规则设置不同的排序规则,从而对于纠错候选词的召回与排序策略进行了解耦,简化了纠错实现,降低了纠错成本。并且,还有利于快速上线各种召回机制,快速补充需要的多模态特征;以及,对于纠错候选词的特征表达也更完备,排序结果更准确、合理。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110185536.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top