[发明专利]一种需求识别方法及需求识别系统有效
申请号: | 201110448800.6 | 申请日: | 2011-12-28 |
公开(公告)号: | CN103186569A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 黄际洲;钟华;柴春光 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 需求 识别 方法 系统 | ||
【技术领域】
本发明涉及计算机技术领域,特别涉及一种需求识别方法及需求识别系统。
【背景技术】
随着互联网在全球范围内的迅速发展与成熟,网络上的信息资源不断丰富,信息数据量也在飞速膨胀,通过搜索引擎获取信息已经成为现代人获取信息的主要方式。为了向用户提供更加便捷、准确地查询服务是搜索引擎技术在当今和未来的发展方向。在搜索引擎技术中,对用户的搜索需求进行识别是提高搜索准确性和有效性的重要一环,特别在结构化搜索(即垂直搜索)中作用显著。
现有需求识别的方式中,不同需求类型采用的需求识别方式不完全相同,例如各需求类型均采用了精确识别方式和模板匹配方式结合的具体处理方式,但在进行预处理或退场降级时可能会采用不同的处理方式,这就需要分别针对各需求识别方式编写代码,但往往不同需求类型的识别方式中具体的处理方式会存在重叠,例如采用了相同的精确识别方式或模板匹配方式,其中也可能存在相同的词典,如果每一个需求识别方式都人工的编写一遍代码显然十分耗费人力资源。例如,如果存在20类需求类型,平均每个需求类型中的需求识别方式包含3个具体的处理方式和词典,则需要人工编写60个处理方式和词典的代码,工作量很大,效率也十分低下。
【发明内容】
本发明提供了一种需求识别方法及需求识别系统,以便于节约人力资源,提高效率。
具体技术方案如下:
一种需求识别方法,该方法包括:
S1、系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
S2、获取待识别搜索项query;
S3、遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对所述待识别query进行需求识别,直至遍历完毕;
S4、输出所述步骤S3的识别结果。
根据本发明一优选实施例,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
根据本发明一优选实施例,所述步骤S1具体包括:
S11、系统启动时,加载配置文件至内存;
S12、从所述配置文件中解析出各需求类型的识别方式和采用的词典;
S13、根据步骤S12的识别结果加载词典文件。
根据本发明一优选实施例,所述步骤S11具体为:系统启动时,在内存中创建一个数据容器,将配置文件中的各需求类型分别作为所述数据容器的一个节点进行存储;
所述步骤S13为在所述数据容器的各节点读入对应需求类型的词典文件;
步骤S3中遍历所述各需求类型为:遍历所述数据容器中的各节点。
根据本发明一优选实施例,该方法还包括:
如果检测到词典文件更新,则在内存中创建一个新的数据容器,将配置文件中的各需求类型分别作为所述新的数据容器的节点进行存储,并对于未更新的词典文件复用原来的数据容器中的内容,将更新后的词典文件读入所述新的数据容器的对应节点;
获取到待识别query时,如果发现存在两个数据容器,则针对该待识别query的需求识别切换至所述新的数据容器。
根据本发明一优选实施例,待所有线程的待识别query都切换至所述新的数据容器时,释放原来的数据容器;
所述释放原来的数据容器具体为:保留被所述新的数据容器复用的内容,删除未被所述新的词典文件复用的内容。
一种需求识别系统,该系统包括:
启动配置单元,用于在系统启动时,读取配置文件并从配置文件中解析出各需求类型的识别方式和采用的词典;
输入单元,用于获取待识别搜索项query;
识别遍历单元,用于遍历所述各需求类型,分别调用遍历到的需求类型的识别方式对应的需求识别函数,结合遍历到的需求类型采用的词典对所述待识别query进行需求识别,直至遍历完毕;
输出单元,用于输出所述识别遍历单元的识别结果。
根据本发明一优选实施例,所述需求类型对应的识别方式包括:精确匹配方式和模板匹配方式中的一种或组合;或者,
进一步包括:预处理方式、降级退场方式和补充处理方式中的一种或任意组合。
根据本发明一优选实施例,所述启动配置单元具体包括:
文件加载子单元,用于在系统启动时加载配置文件至内存;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110448800.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种垃圾循环处理设备
- 下一篇:用于去除水中氟的壳聚糖/天然沸石材料