[发明专利]一种检索请求语义扩展方法在审
| 申请号: | 201210518552.2 | 申请日: | 2012-12-05 |
| 公开(公告)号: | CN102999625A | 公开(公告)日: | 2013-03-27 |
| 发明(设计)人: | 庞晓曦;王树强;宋传宝 | 申请(专利权)人: | 北京海量融通软件技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;董烨飞 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 检索 请求 语义 扩展 方法 | ||
技术领域
本发明涉及一种对用户的检索请求进行语义扩展的方法,属于网络搜索技术领域。
背景技术
搜索引擎是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,从而为用户提供检索服务的信息服务系统。现有的搜索引擎根据用户提供的关键词进入自身的数据库系统进行检索,并将搜索结果反馈给用户。在这个过程中,往往用几个简单的关键词很难表达出用户真正的搜索意图,或者用户不知道应该输入什么样的关键词,才能准确表达自己需要搜索的信息。而搜索引擎需要根据用户输入的信息进行分析判断,并根据判断结果来提供搜索结果。因此,现有搜索引擎的搜索结果与用户的需求之间经常是答非所问,令人失望。
为了让用户能够检索到其所期望的搜索结果,对用户输入的检索词进行扩展成为一个可行的方法。这方面已有一些较为成熟的技术方案。例如美国谷歌公司在申请号为200880024690.7的中国专利申请中,提出了一种用于提供搜索查询信息的系统,利用历史搜索查询信息的统计,依据当前输入的查询与之匹配,得到扩展的搜索查询信息。具体地说,该系统接收对搜索查询信息的请求,从搜索查询日志识别搜索查询集合,搜索查询日志包括在预定时间长度内提交给搜索服务的搜索查询,并且提供所述搜索查询集合。所述搜索查询集合中的每一个与至少预定数量的独特标识符相关联。所述搜索查询集合中的每一个通过精确匹配、扩展匹配和宽泛匹配而与对搜索查询信息的请求相匹配。
在申请号为200810151074.X的中国专利申请中,也公开了一种关键词自动扩展查询方法,通过关键词识别码做一级关键词扩展。该方法包括以下步骤:1)建立一数据库:该数据库包含关键词、词汇和识别码;2)将关键词与至少一词汇对应;3)将相关的关键词与一识别码对应;4)通过用户输入的关键词,确定数据库中与该关键词对应的识别码;5)通过该识别码提取该识别码对应相关的关键词;6)通过相关的关键词,查询出与每一相关的关键词对应的词汇。
另外,在申请号为201110089889.1的中国专利申请中,提出了一种基于关键词的WEB服务器扩展检索方法,将关键词进行语义扩展,利用扩展后的增量关键词提供检索。具体地说,该方法由WEB服务器提供的检索系统自动扩展出与用户所输入关键词相对应的扩展词进行辅助检索,即WEB服务器的检索系统在进行检索之前,先根据扩展条件自动把用户查询的关键词进行语义扩展,从而形成新的查询条件,并检索相匹配的信息文本返回给用户。该技术方案可以增强WEB服务器的语义扩展检索性能,并且扩展条件可灵活选择,能够更好地满足人们对于语义信息检索的灵活性需求。
发明内容
本发明所要解决的技术问题在于提供一种检索请求语义扩展方法。该方法可以用在搜索引擎中,对用户的检索请求进行语义扩展,从而提高搜索结果的精度。
为实现上述的发明目的,本发明采用下述的技术方案:
一种检索请求语义扩展方法,包括如下步骤:
接收用户的检索请求;
对所述检索请求进行分词处理,生成关键词;
基于知识树对所述关键词进行语义扩展,生成扩展后的关键词组合;
对所述关键词组合,结合检索组合库进行最优匹配组合查询,得到有效检索组合;
将所述有效检索组合与用户已经输入的检索请求合并,生成有效检索组合集。
其中较优地,在对所述检索请求进行分词处理时,过滤停用词。
其中较优地,所述知识树由若干个语义节点构成,每个语义节点下包括不同维度的语义扩展。
其中较优地,所述语义扩展包括同义词集、汉语拼音集、拆字变形集、错别字词集和其他变形词集。
其中较优地,在进行最优匹配组合查询时,以所述关键词组合进行输入,查询所述检索组合库,得到所述关键词组合的频度和匹配相似度,然后利用所述频度和所述匹配相似度对所述关键词组合计算得分,并进行排序,在排序后优选所述关键词组合的个数,得到有效检索组合。
其中较优地,所述检索组合库用于记录检索关键词组合请求的时刻、频次。
其中较优地,在生成所述有效检索组合集后,将用户继续输入的关键词组合存储到所述检索组合库中;如果所述关键词组合已经存在则记录存储时刻,更新频次;如果不存在,创建新记录。
本发明所提供的检索请求语义扩展方法能够实现多维度语义扩展,并且通过最优匹配组合查询将大量的多重组合集快速聚焦到有效检索组合集中,实现了充分的语义扩展与真实有意义的检索组合的有机结合,有效提高了搜索结果的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海量融通软件技术有限公司,未经北京海量融通软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210518552.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烧结稀土永磁材料及其制备方法
- 下一篇:汉字输入方法





