[发明专利]自适应性调整关联搜索词的系统及其方法有效
申请号: | 201910088844.9 | 申请日: | 2019-01-29 |
公开(公告)号: | CN111324705B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 沈民新 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06F40/247 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 中国台湾新竹*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应性 调整 关联 搜索词 系统 及其 方法 | ||
1.一种自适应性调整关联搜索词的系统,包括:
一输入装置,用以接收一搜索词;
一记录收集模块,用以判断该搜索词的累计搜索次数是否大于一第一阈值或小于一第二阈值;
一阈值设定模块,用以设定满足该第一或该第二阈值的搜索记录的数量;以及
一演化模块,用以根据搜索记录的该数量多寡调整一搜索流程,其中当该搜索词的累计搜索次数大于该第一阈值时,该演化模块根据一历史搜索记录找出与该搜索词的内容或属性相关的至少一历史搜索词,
其中,当该搜索词的累计搜索次数小于该第二阈值时,该演化模块执行一初期搜索流程,以找出一文本中与该搜索词的内容或属性相关的至少一关联词,
其中,当该搜索词的累计搜索次数介于该第一阈值与该第二阈值之间时,该演化模块对中期搜索流程进行优化,以进一步找出该文本中及该历史搜索记录中与该搜索词的内容或属性相关最大化的该至少一关联词和/或该至少一历史搜索词。
2.如权利要求1所述的系统,还包括:
一索引词表;以及
一文本关联词产生模块,根据该索引词表,用以分析该文本中与该搜索词最相关的前M个索引词,以产生一文本关联词表;以及
一记录关联词产生模块,用以分析该历史搜索记录中任两个历史搜索词之间的关联程度,找出与该搜索词最相关的前N个历史搜索词,以产生一记录关联词表。
3.如权利要求2所述的系统,其中该文本关联词产生模块根据该搜索词与这些索引词单独出现或共同出现在该文本中的几率计算一关联强度。
4.如权利要求2所述的系统,其中该记录关联词产生模块根据该搜索词与这些历史搜索词的内容或属性单独出现或共同出现在该历史搜索记录中的几率计算一关联强度。
5.如权利要求2所述的系统,还包括:
一关联词鉴别度计算模块,根据该索引词表、该记录关联词表以及该文本关联词表计算各该关联词的鉴别值;以及
一关联词推荐模块,用以比较该记录关联词表中各该关联词的鉴别值以及该文本关联词表中各该关联词的鉴别值,并根据各该关联词的鉴别值的排序,从该文本关联词表及该记录关联词表中挑选鉴别值较高的前P个关联词。
6.如权利要求5所述的系统,其中该关联词鉴别度计算模块根据各该关联词出现在该文本中的一差异程度计算鉴别值,该差异程度与各该关联词出现在单一该文本或复数个该文本中的频率有关。
7.如权利要求2所述的系统,还包括:
一分词模块,用以接收该搜索词,当该搜索词不存在该文本中时,该分词模块根据该索引词表将该搜索词拆解为至少一索引词。
8.如权利要求5所述的系统,还包括:
一新词发现模块,用以辨识该关联词是否包含未存在于该索引词表中的一新词,其中当该关联词包含该新词时,该关联词鉴别度计算模块根据该关联词及包含的该新词计算该关联词的鉴别值。
9.如权利要求1至8其中的一项所述的系统,其中该系统以一处理器执行或由该处理器载入的一软件程序执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910088844.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:利用动态位置误差模拟切削方法
- 下一篇:便携式榨汁机