[发明专利]文章搜索方法和装置、计算机设备以及存储介质在审
申请号: | 202110930111.2 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113761129A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 张微微 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F16/338;G06F16/35;G06F40/289 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 王海臣 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 搜索 方法 装置 计算机 设备 以及 存储 介质 | ||
本发明提供了一种文章搜索方法和装置、计算机设备以及存储介质,其中,文章搜索方法包括:接收用户通过终端输入的搜索请求,搜索请求中携带有搜索词;基于数据库确定搜索词对应的多篇文章,数据库包括文章、索引内容和类别标签的对应关系,索引内容是通过对文章进行分词解析得到的,类别标签用于指示索引内容的类别;按照预定规则确定多篇文章的排列顺序;向终端输出反馈信息,反馈信息包括多篇文章和排列顺序。解决了现有技术中的搜索方法无法快速搜索到用户想要的结果的问题。
技术领域
本发明涉及互联网技术领域,具体涉及一种文章搜索方法和装置、计算机设备以及存储介质。
背景技术
搜索是指用户通过终端输入搜索词或关键词,由服务器在接收到终端发送的搜索词后,根据搜索词在网络上查找相关内容,并向终端反馈搜索结果。在相关技术中,以图书为例,服务器通常只能识别书名和作者之类的搜索词。这种情况下,一旦用户忘记书名和作者,将很难快速搜索到自己想要的结果,浪费时间和精力。
发明内容
有鉴于此,本发明实施例提供一种文章搜索方法和装置、计算机设备以及存储介质,以解决现有技术中的搜索方法无法快速搜索到用户想要的结果的问题。
本发明第一方面提供了一种文章搜索方法,包括:接收用户通过终端输入的搜索请求,搜索请求中携带有搜索词;基于数据库确定搜索词对应的多篇文章,数据库包括文章、索引内容和类别标签的对应关系,索引内容是通过对文章进行分词解析得到的,类别标签用于指示索引内容的类别;按照预定规则确定多篇文章的排列顺序;向终端输出反馈信息,反馈信息包括多篇文章和排列顺序。
在一个实施例中,在接收用户通过终端输入的搜索请求之前,还包括:获取文章;对文章进行分词解析,以识别出文章中的词或词序列;基于预设的识别词表识别出词或词序列中的预定词,并为预定词配置类别标签。其中,识别词表包括预定词和类别标签的对应关系,索引内容包括预定词。
在一个实施例中,索引内容包括从文章中提取出的实体词;类别标签包括实体类别标签。
在一个实施例中,在按照预定规则确定多篇文章的排列顺序之前,还包括:基于索引内容和类别标签中的至少一项与搜索词的相关程度,确定多篇文章各自的搜索意图分,搜索意图分用于指示文章和搜索词之间的匹配程度。按照预定规则确定多篇文章的排列顺序包括:按照搜索意图分由高到低的顺序确定多篇文章的排列顺序。
在一个实施例中,在按照预定规则确定多篇文章的排列顺序之前,还包括:基于数据库确定多篇文章各自的搜索意图得分,搜索意图得分用于指示文章和搜索词之间的匹配程度;基于用户的用户画像对多篇文章各自的搜索意图分进行调整,用户画像用于指示用户对文章的偏好信息。输出反馈信息包括:按照预定规则确定多篇文章的排列顺序包括:按照调整后的搜索意图分由高到低的顺序确定多篇文章的排列顺序。
在一个实施例中,基于用户的用户画像对多篇文章各自的搜索意图分进行调整包括:基于预先训练的匹配模型,对多篇文章分别进行至少一个维度的特征提取;将提取到的特征和用户画像之间进行匹配度计算,得到多篇文章各自与用户画像之间的匹配度;基于匹配度对搜索意图分进行调整。
本发明第二方面提供了一种文章搜索装置,包括:接收模块,用于接收用户通过终端输入的搜索请求,搜索请求中携带有搜索词;第一确定模块,用于基于数据库确定搜索词对应的多篇文章,数据库包括文章、索引内容和类别标签的对应关系,索引内容是通过对文章进行分词解析得到的,类别标签用于指示索引内容的类别;排序模块,用于按照预定规则确定所述多篇文章的排列顺序;反馈模块,用于向终端输出反馈信息,反馈信息包括多篇文章和排列顺序。
在一个实施例中,文章搜索装置还包括:获取模块,用于获取文章;解析模块,用于对文章进行分词解析,以识别出文章中的词或词序列;配置模块,用于基于预设的识别词表识别出词或词序列中的预定词,并为预定词配置类别标签;识别词表包括预定词和类别标签的对应关系,索引内容包括预定词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110930111.2/2.html,转载请声明来源钻瓜专利网。