[发明专利]一种识别搜索对应的需求分类的方法和系统有效
申请号: | 201410330444.1 | 申请日: | 2014-07-11 |
公开(公告)号: | CN104199822B | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 杨锦峰;吴峰 | 申请(专利权)人: | 五八同城信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律恒立业知识产权代理事务所(特殊普通合伙) 11416 | 代理人: | 顾珊;庞立岩 |
地址: | 300457 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 搜索 对应 需求 分类 方法 系统 | ||
本发明提供了一种识别搜索对应的需求分类的方法和系统。所述方法包括如下步骤:a)对输入的搜索词进行分词操作,得到至少一个关键词;b)提取所述关键词在神经网络语言模型中的模型向量;c)根据所述模型向量计算所述搜索词在多个需求分类下的相关性分数,并生成待识别向量;d)利用分类器对待识别向量进行判断,得到所述搜索词对应的需求分类。根据本发明的搜索识别方法和系统,可以识别用户输入的搜索关键词从而为用户匹配特定的需求分类信息类目,以便在该需求类目下进行针对性的分类信息查找,系统能够准确高效地对搜索需求进行识别。
技术领域
本发明涉及分类信息网站的搜索技术,特别是一种识别分类信息搜索对应的需求分类的方法和系统。
背景技术
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接清单等。随着互联网在全球范围内的迅速发展与成熟,网络上的信息资源不断丰富,信息数据量也在飞速膨胀,通过搜索引擎获取信息已经成为现代人获取信息的主要方式。
在线分类信息网站是基于WEB2.0技术的互联网应用模式,它很好地弥补了传统分类广告的不足。分类信息不仅信息量大,而且信息随时在线,永不丢失。更重要的利用分类搜索,可以保证用户在任何时间、任何地点,都能实现方便快捷的查询。在分类信息网站中,由于需求的导向,分类信息大多集中在房屋租赁、二手转让、求职招聘等直接关系到使用者切身短期利益的领域。当人们满足这类需求时,通常要通过比较多个信息,然后在这些海量信息中筛选出一个能最大程度满足自身需求的信息,再做出购买决策。因此,专门针对于分类信息网站的搜索技术成为影响分类信息网站用户使用体验的关键。
随着分类信息网站搜索引擎技术的发展,用户已经不仅仅满足于从搜索引擎中获取与搜索关键词匹配的内容,而是希望能够获得与自己搜索目的相关的结果。为了向使用者提供与搜索目的相关的搜索结果,就必须先对用户的搜索需求进行识别,才能够根据识别出的需求返回相应资料资源的搜索结果,或者根据识别出的需求对搜索结果进行相应形式的展现。因此对用户的搜索需求进行识别是提高搜索准确性和有效性的重要一环。
现有的分类信息搜索需求识别通常简单的采用匹配预置的大量关键词的方式,或以融合搜索引擎的搜索结果确定所述待识别query的需求类型或类目(分层类目)。采用匹配方法结合词典和范本,需要大量词及人力成本。而采用融合搜索引擎的搜索结果以增加搜索词的特征,会因搜索的排序结果,直接影响效果。
因此,需要一种识别搜索需求的方法和系统,以准确高效地对搜索需求进行识别。
发明内容
本发明的目的是提供一种识别搜索对应的需求分类的方法和系统。
根据本发明的实施例,所述方法包括如下步骤:a)对输入的搜索词进行分词操作,得到至少一个关键词;b)提取所述关键词在神经网络语言模型中的模型向量;c)根据所述模型向量计算所述搜索词在多个需求分类下的相关性分数,并生成待识别向量;d)利用分类器对待识别向量进行判断,得到所述搜索词对应的需求分类。
根据本发明的实施例,所述系统包括:分词模块、向量生成模块,以及分类器模块,所述分词模块对输入的词进行分词操作,得到关键词;所述向量生成模块用于根据所述关键词生成向所述分类器模块输出的待识别向量;所述分类器模块对所述向量生成模块输入的所述待识别向量进行判断,得到所述搜索词对应的需求分类。
根据本发明的分类信息搜索识别方法,通过对搜索词的分词,并利用神经网络语言模型对检索词进行向量化,再利用较少的热词进行相关性计算,实现对搜索的需求类别的识别。根据本发明的搜索识别方法,可以识别用户输入的搜索关键词从而为用户匹配特定的需求分类信息类目,以便在该需求类目下进行针对性的分类信息查找,系统能够准确高效地对搜索需求进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八同城信息技术有限公司,未经五八同城信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410330444.1/2.html,转载请声明来源钻瓜专利网。