[发明专利]针对特定搜索场景的搜索处理方法、装置、设备及介质有效
| 申请号: | 202111516197.0 | 申请日: | 2021-12-07 | 
| 公开(公告)号: | CN114186023B | 公开(公告)日: | 2023-05-26 | 
| 发明(设计)人: | 陈增 | 申请(专利权)人: | 北京金堤科技有限公司 | 
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289 | 
| 代理公司: | 北京中慧创科知识产权代理事务所(特殊普通合伙) 11721 | 代理人: | 王馨 | 
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 针对 特定 搜索 场景 处理 方法 装置 设备 介质 | ||
本公开提供了一种针对特定搜索场景的搜索处理方法、装置、设备及介质,涉及人工智能和互联网技术领域,具体涉及智能搜索和智能推荐等技术领域。该方法包括:对涉及特定搜索场景的搜索语句中的至少一个分词进行语义标签的标注,以获得与搜索语句关联的至少一个第一语义标签;获取与涉及特定搜索场景的搜索文本关联的至少一个第二语义标签;基于至少一个第一语义标签和至少一个第二语义标签,确定并输出用于表征搜索语句中标注有目标语义标签的分词与搜索文本中标注有目标语义标签的分词之间的相关性的第一相关性表征数据;基于第一相关性表征数据,确定并输出用于表征搜索语句与搜索文本之间的相关性的第二相关性表征数据。
技术领域
本公开实施例涉及互联网技术领域,具体涉及智能搜索和智能推荐等技术领域,可应用于涉及企业、机构、学校等实体的搜索场景,尤其涉及一种针对特定搜索场景的搜索处理方法、装置、电子设备及计算机存储介质。
背景技术
随着互联网网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时的重要工具。目前,在进行目标搜索时,用户可以在搜索引擎或门户网站中输入搜索语句,搜索引擎或门户网站根据输入的搜索语句进行相关信息的搜索,将多条搜索结果展示在网页中。这样,用户就可以在网页中逐条筛选所需的信息。其中,搜索结果包括搜索文本的链接地址,用户点击网页中的搜索文本的链接地址,可以展示根据搜索语句搜索得到的搜索文本。
在搜索业务中,相关性指的是搜索引擎反馈的搜索结果和用户真正的搜索需求是否匹配,即能否满足用户的真实搜索需求,因此,相关性是比较重要的特征。相关性用于搜索业务的各个环节,例如,召回、粗排、精排等。但是在不同的搜索业务中,数据多种多样,行业领域差异化明显,采用不同的算法对不同的搜索业务进行优化,往往能更大程度上提升整体的搜索效果。例如,在搜索企业信息的场景下(如,搜索某个企业),涉及企业搜索场景的搜索语句(以下简称企业搜索语句)一般比较短,并且带有较强的企业语义信息,现有的统计方法在计算企业搜索文本的相关性时,缺少对企业搜索语句的语义理解,导致针对企业搜索文本的相关性的计算结果的准确度不高。
由此可见,如何有效提高搜索文本的相关性的准确度成为当前亟待解决的技术问题。
发明内容
有鉴于此,本公开实施例提供了一种针对特定搜索场景的搜索处理方法、装置、电子设备及计算机存储介质。
根据本公开实施例的第一方面,提供了一种针对特定搜索场景的搜索处理方法,所述方法包括:对涉及特定搜索场景的搜索语句中的至少一个分词进行语义标签的标注,以获得与所述搜索语句关联的至少一个第一语义标签;获取与涉及所述特定搜索场景的搜索文本关联的至少一个第二语义标签,其中,所述至少一个第二语义标签是基于所述搜索文本中的至少一个分词进行语义标签的标注得到的;基于所述至少一个第一语义标签和所述至少一个第二语义标签,确定并输出用于表征所述搜索语句中标注有目标语义标签的分词与所述搜索文本中标注有所述目标语义标签的分词之间的相关性的第一相关性表征数据;基于所述第一相关性表征数据,确定并输出用于表征所述搜索语句与所述搜索文本之间的相关性的第二相关性表征数据。
根据本公开实施例的第二方面,提供了一种针对特定搜索场景的搜索处理装置,所述装置包括:标注模块,用于对涉及特定搜索场景的搜索语句中的至少一个分词进行语义标签的标注,以获得与所述搜索语句关联的至少一个第一语义标签;获取模块,用于获取与涉及所述特定搜索场景的搜索文本关联的至少一个第二语义标签,其中,所述至少一个第二语义标签是基于所述搜索文本中的至少一个分词进行语义标签的标注得到的;第一确定模块,用于基于所述至少一个第一语义标签和所述至少一个第二语义标签,确定并输出用于表征所述搜索语句中标注有目标语义标签的分词与所述搜索文本中标注有所述目标语义标签的分词之间的相关性的第一相关性表征数据;第二确定模块,用于基于所述第一相关性表征数据,确定并输出用于表征所述搜索语句与所述搜索文本之间的相关性的第二相关性表征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111516197.0/2.html,转载请声明来源钻瓜专利网。





