[发明专利]一种智能垂直搜索方法和系统在审
申请号: | 201410328404.3 | 申请日: | 2011-09-29 |
公开(公告)号: | CN104063513A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | 赵轶;许小东 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 垂直 搜索 方法 系统 | ||
1.一种智能垂直搜索方法,其特征在于,包括:
获取用户端选择的一行业中输入的查询词;
根据所述查询词与分类数据库中的该行业已分类的各条目匹配的结果,获取各类别与查询词相关的条目,并按类别将各所述类别的条目及相关信息展现给用户;其中,所述的条目为电子商务网页中的一项或多项业务内容;
其中,所述该行业已分类的各条目通过以下步骤获得:
获取所述行业所有网页的所有条目及相关信息;
将各条目中的关键词与该行业各类别对应的关键词的词法匹配结果进行加权分析确定各条目所属类别;
和/或,根据未分类条目的各关键词的出现次数比率与根据预先统计获得的已分类条目的各关键词的出现概率的相似度确定各条目所属类别。
2.根据权利要求1所述的方法,其特征在于,所述的查询词包括:
将用户的输入的关键词作为查询词;
或者,将用户选择的根据该用户的输入词返回的建议词中的一个作为查询词;其中,所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。
3.根据权利要求1所述的方法,其特征在于,还包括以下安全检测步骤:
步骤A、对于所述获取的待分类的每个条目所在的链接地址,通过安全检查引擎和木马查杀引擎检查所述链接地址是否安全,如果安全,则对所述条目进行分类;
和/或,步骤B,对于所述分类数据库中的已分类的条目所在的链接地址,通过安全检查引擎不断遍历每个链接地址,如果不安全,则将该链接地址的相关数据从分类数据库中删除;
和/或,步骤C,对于用户点击的一条目所在的链接地址,通过安全检查引擎检查该链接地址是否安全,如果不安全,则提示用户并在分类数据库中将该链接地址的相关数据删除。
4.根据权利要求3所述的方法,其特征在于,通过安全检查引擎和木马查杀引擎检查所述链接地址是否安全的过程通过以下步骤进行:
步骤P1,对于所述获取的待分类的每个条目所在的链接地址,将该链接地址提交给安全检查引擎检查其是否在安全等级库中存在;
步骤P2,如果存在并安全,则对所述条目进行分类;
步骤P3,如果存在但不安全,则发送警告信息,并过滤掉该链接地址的相关数据;
步骤P4,如果不存在,则通过木马查杀引擎检查该链接地址,判断该链接是否安全,如果安全,将该链接地址存入安全等级库,并转入步骤P1。
5.根据权利要求1所述的方法,其特征在于,还包括以下安全检测步骤:
通过包括所述条目的链接地址icp备案信息和/或网站实名认证系统对所述条目进行安全检测。
6.根据权利要求1所述的方法,其特征在于,在获取所述行业所有网页的所有条目及相关信息时包括:
自动抓取步骤,用于自动抓取所述行业所有网页的所有条目及相关信息;
补充录入步骤,用于补充录入一网页的条目及相关信息。
7.根据权利要求1所述的方法,其特征在于,在按类别将各所述类别的条目及相关信息展现给用户端时包括:
将条目相关的用户行为入口直接提供给用户端。
8.根据权利要求1所述的方法,其特征在于,还包括:
智能纠错步骤,通过智能纠错引擎对于用户错误输入的查询词进行纠错。
9.根据权利要求1所述的方法,其特征在于:
所述条目各关键词i的出现次数比率与已分类条目各关键词i的出现概率的差值,通过对数加权,计算出条目对应的分类c偏差值G(c),偏差值越小则相似度越高,取最低的偏差值所在分类来确定条目所属分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410328404.3/1.html,转载请声明来源钻瓜专利网。