[发明专利]一种智能辅助搜索输入的方法在审
申请号: | 202210083151.2 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114385925A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 于敬;周明星;石京京;刘文海;陈运文;纪达麒 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F16/957 |
代理公司: | 上海智力专利商标事务所(普通合伙) 31105 | 代理人: | 周涛 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 辅助 搜索 输入 方法 | ||
1.一种智能辅助搜索输入的方法,其特征在于,该方法包括以下步骤:
S1.数据前处理:取最近一段时间内包括搜索行为和提示点击行为的行为数据集,基于所述行为数据集中搜索行为数据,获取滤重之后的用户查询语句数据集,将所述用户查询语句数据集的长度记为,将所述行为数据集中搜索行为的数量记为,将所述提示点击行为的数量记为,将所述用户查询语句数据集全部存入树Trie中,记为,将所述用户查询语句数据集全部使用word2vec模型生成词向量后存入Faiss中,并记为,将全量待搜索的内容信息导入到Elasticsearch中,并记为,所述内容信息包括字段信息,所述字段信息包括标题、标签、描述和正文;将当前时间的时间戳记为,对于待提示的搜索查询,其字符串长度记为;
S2.多路召回候选集:对待提示的搜索查询进行多路召回,所述多路召回包括前序匹配召回、词嵌入召回和文本语义召回,然后将所述前序匹配召回、词嵌入召回和文本语义召回的结果进行归并,并作滤重处理,得到最终的M条候选结果;
S3.静态分析和动态分析:对于步骤S2中所得的M条候选结果集合,将第条结果记为,分别进行静态分析和动态分析,所述静态分析包括前序匹配分析和全局匹配分析,所述静态分析用于分析候选结果的文本相关性,所述动态分析包括行为数据分析、用户兴趣分析、上下文分析和时效性分析,所述动态分析用于对候选结果结合用户历史行为数据进行综合分析;
S4.融合排序:根据步骤S3中静态分析和动态分析结果,融合计算的总体质量分,然后将M条候选结果集合按照质量分大小从大到小排序,取排在最前面的Top K条结果返回作为智能辅助输入的最终结果。
2.根据权利要求1所述的一种智能辅助搜索输入的方法,其特征在于,在步骤S2中,所述前序匹配召回的方法包括对待提示的搜索查询按照前序方式对进行最长匹配查询,然后对返回结果按照树深度从高到低排序,取TopN条返回;所述词嵌入召回的方法包括将待提示的搜索查询使用word2vec生成词向量到中查询到最相似的TopN条结果返回;所述文本语义召回的方法包括将待提示的搜索查询调用中suggest功能查询到TopN条结果返回。
3.根据权利要求1所述的一种智能辅助搜索输入的方法,其特征在于,在步骤S3中,所述前序匹配分析的方法包括以下步骤:将步骤S2中所得的M条候选结果集合从前往后逐一匹配,得到最长匹配字串的长度,表示的长度,表示和的最小者,和分别表示和待提示的搜索查询在第位置上的值,通过如下方式计算待提示的搜索查询和的前序匹配度:
。
4.根据权利要求1所述的一种智能辅助搜索输入的方法,其特征在于,在步骤S3中,所述全局匹配分析的方法包括以下步骤:对待提示的搜索查询和分别进行预处理,分别得到新的词集合,并分别记为和,所述预处理包括分词、去除停用词和滤重,然后通过如下方式计算和的全局匹配度:
,
其中,表示同时出现在和中的词的总数,表示中词的数量。
5.根据权利要求1所述的一种智能辅助搜索输入的方法,其特征在于,在步骤S3中,所述行为数据分析的方法包括以下步骤:在所述行为数据集中计算对应的搜索行为数量为和提示点击行为数量为,然后通过如下方式计算对应的用户投票分:
,
其中,是个常量,为0到1之间的值。
6.根据权利要求1所述的一种智能辅助搜索输入的方法,其特征在于,在步骤S3中,所述用户兴趣分析的方法包括以下步骤:获取当前用户的最近P条查询语句,并获取每条语句word2vec处理后的向量进行求和,对应为向量,待提示的搜索查询对应的word2vec处理后的向量记为向量,然后通过如下方式计算用户对的感兴趣程度:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210083151.2/1.html,转载请声明来源钻瓜专利网。