[发明专利]自适应性调整关联搜索词的系统及其方法有效
申请号: | 201910088844.9 | 申请日: | 2019-01-29 |
公开(公告)号: | CN111324705B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 沈民新 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06F40/247 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 中国台湾新竹*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应性 调整 关联 搜索词 系统 及其 方法 | ||
本发明公开了一种自适应性调整关联搜索词的系统,包括一输入装置、一记录收集模块、一阈值设定模块以及一演化模块。输入装置用以接收一搜索词。记录收集模块用以判断搜索词的累计搜索次数是否大于一第一阈值或小于一第二阈值。阈值设定模块用以设定满足第一或第二阈值的搜索记录的数量。当搜索词的累计搜索次数介于第一阈值与第二阈值之间时,演化模块对中期搜索流程进行优化,以进一步找出索引文本中及历史搜索记录中与搜索词的内容或属性相关最大化的至少一关联词和/或至少一历史搜索词。
技术领域
本发明有关于一种自适应性调整关联搜索词的系统及其方法。
背景技术
现代搜索系统通常会在搜索结果中同时回馈给用户和搜索词相关的其它搜索词,用以协助用户快速厘清查询目标,其原因在于用户使用的搜索关键词常常无法以简短的词汇精确地描述其搜索意图,或是用户给定的搜索词或搜索目标有多种描述方式或歧义性而造成用户与文本间的词汇用语不匹配,或是用户对于搜索目标事物的理解或知识不足而误用错误的搜索词,又或是用户打字错误如同音或近音等等因素。一般而言,关联搜索词的提取技术可根据数据来源区分为基于索引文本内容的方法和基于历史查询记录的方法。以文本为基础的方法在搜索系统上线前期,立即可以根据索引文本内容中词汇之间的相关分析提供关联搜索词的建议清单,但其缺点是仅能根据固定的文本内容提供建议,无法根据后期累积的历史查询记录分析预测用户的搜索意图。虽然基于历史查询记录的方法则可以根据不断累积的用户数据提供最新的搜索意图预测,从而得到更好的关联搜索词的建议清单,但却无法在系统前期立刻提供建议,需要经过长时间的用户使用,才能累积数量足够的分析数据来源。现有方法中也有利用权重整合方法结合上述两种方法,使得不论在搜索系统的前期没有用户历史数据阶段或者是在后期累积足够历史数据阶段,均可以推荐关联搜索词。
然而,权重整合方法同样有权重组合的数据来源问题,人工设定往往无法达到最佳效果,通常需要累积足够的搜索记录数据,才能以统计模型或机器学习方式训练得到第一组最佳权重组合,并且仍有不同垂直领域的转移学习的困难问题。因此,上述提取技术分别适用于不同上线时期的搜索系统,由于搜索记录多寡不同,因而无法随时提供适合建议用户的关联搜索词,有必要提出改进的方法。
发明内容
本发明有关于一种自适应性调整关联搜索词的系统及其方法,可根据系统累积的搜索记录的数量自我调整关联搜索词,以提供适合建议用户的关联搜索词。
根据本发明的一方面,提出一种自适应性调整关联搜索词的系统,包括一输入装置、一记录收集模块、一阈值设定模块以及一演化模块。输入装置用以接收用户输入并产出一搜索词。记录收集模块用以判断搜索词的累计搜索次数是否大于一第一阈值或小于一第二阈值。阈值设定模块用以设定满足第一或第二阈值的搜索记录的数量。演化模块用以根据搜索记录的数量多寡调整一搜索流程,其中当搜索词的累计搜索次数大于第一阈值时,演化模块根据一历史搜索记录找出与搜索词的内容或属性相关的至少一历史搜索词。当搜索词的累计搜索次数小于第二阈值时,演化模块执行一初期搜索流程,以找出一文本中与搜索词的内容或属性相关的至少一关联词。当搜索词的累计搜索次数介于第一阈值与第二阈值之间时,演化模块对中期搜索流程进行优化,以进一步找出文本中及历史搜索记录中与搜索词的内容或属性相关最大化的至少一关联词和/或至少一历史搜索词。
根据本发明的一方面,提出一种自适应性调整关联搜索词的方法,包括下列步骤。输入流程用以接收用户输入并产出一搜索词。记录收集流程用以判断搜索词的累计搜索次数是否大于一第一阈值或小于一第二阈值。阈值设定流程用以设定满足第一或第二阈值的搜索记录的数量。演化流程,用以根据搜索记录的数量多寡调整一搜索流程,其中当搜索词的累计搜索次数大于第一阈值时,演化流程根据一历史搜索记录找出与搜索词的内容或属性相关的至少一历史搜索词。当搜索词的累计搜索次数小于第二阈值时,演化流程执行一初期搜索流程,以找出一文本中与搜索词的内容或属性相关的至少一关联词。当搜索词的累计搜索次数介于第一阈值与第二阈值之间时,演化流程对中期搜索流程进行优化,以进一步找出文本中及历史搜索记录中与搜索词的内容或属性相关最大化的至少一关联词和/或至少一历史搜索词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910088844.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:利用动态位置误差模拟切削方法
- 下一篇:便携式榨汁机