[发明专利]搜索资源静态化的实现方法及系统在审
申请号: | 201210036735.0 | 申请日: | 2012-02-17 |
公开(公告)号: | CN103257966A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 赵国涛;周文军;王跃伟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 章侃铱;张浴月 |
地址: | 开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 资源 静态 实现 方法 系统 | ||
技术领域
本申请涉及搜索技术领域,尤其涉及一种搜索资源静态化的实现方法及系统。
背景技术
一般的信息开放型网站(例如,公布可售卖产品信息的电子商务网站)通常都有自己的站内搜索引擎,以供访问网站的用户用来检索站内资源。除了常见的关键字检索外,一些网站还采用了基于类目的检索系统。这样,用户可以通过关键字检索,也可以通过网站提供的类目进行检索,还可以组合类目和关键字进行检索,从而方便用户进行快速准确的定位。对于网站运营方来说,通过统计查询频度等指标可以分析挖掘用户所关注的关键字和类目,而这些关键字和类目便是当前网站站内搜索引擎的核心搜索资源。另一方面,百度、谷歌等通用搜索引擎也占据着巨大的市场份额,很多用户实际上都是从通用搜索引擎开始检索各类信息,相应地,从通用搜索引擎导入的流量已经成为电子商务等信息开放型网站不可忽视的访问量来源。因此,如何让上述站内搜索引擎的关键词和类目这些核心搜索资源能够被用户在通用搜索引擎中检索到,一直是信息开放型网站,尤其是电子商务网站所致力的目标。
目前,信息开放型网站的站内搜索引擎通常是将来自用户输入的检索词添加至URL(Universal Resource Locator,统一资源定位符,本文中也称为链接)的参数中,例如:
http://xxx.com/search.htm?query=苹果&category=手机
以上链接中的“苹果”和“手机”便分别对应于搜索资源中的“关键字”和“类目”,而这种格式的链接通常被称为搜索资源的动态表达方式,目前绝大多数的电子商务搜索引擎也都是采用这种动态链接的表达方式。对于使用站内搜索引擎输入关键字、选择类目进行搜索的用户需求来说,上述搜索资源的动态表达方式实现起来较为便捷。然而,当某一网站通过在众多合作网站上投放此类动态链接的形式来推广自身的核心搜索资源,以便让通用搜索引擎能够抓取到从而进行收录时,上述动态表达方式会存在以下问题。
首先,大部分网站会按照HTML规范对其网页上发布的所有链接里的中文(也包括日文、俄文等其他一些多字节字符)进行GBK或者UTF-8编码,而当某一网站在合作网站上发布上述含有中文的动态链接时,便可能会被通用搜索引擎错误解码为乱码后加以收录,从而导致无效收录的严重后果。
其次,由于一般网站的站内搜索引擎通常不仅仅提供关键字和类目两种搜索资源,往往还包括产品地点、产品商标、库存情况等众多搜索资源,相应地,动态链接的参数也数量众多;由于这些动态链接之间的区别仅在于参数部分,而路径(path)部分却完全相同,因而可能会被通用搜索引擎认为是同一个链接的不同表达方式;这样,通用搜索引擎在收录当前网站推广目标的动态链接同时还可能会收录到一些并非推广目标的动态链接,从而分散了推广目标自身的权重,使当前网站无法有效的实现针对性地推广核心搜索资源的目的。
发明内容
本申请的实施例旨在提供一种搜索资源静态化的实现方法及系统,以解决当前普通网站站内搜索引擎不能支持静态链接的问题。
为实现上述目的,本申请的实施例提供了一种搜索资源静态化的链接编码方法,用于根据预设的检索词生成静态链接,其中,该方法包括以下步骤:
S1.根据预设的编码方式将所述检索词转换成单字节字符串;以及
S2.在所述单字节字符串的头部或尾部添加识别标示后将其作为所述静态链接的路径path部分。
本申请的实施例相应还提供一种搜索资源静态化的链接解码方法,用于当前网站的站内搜索引擎根据外链的静态链接生成动态链接,其中,该方法包括以下步骤:
S1’.根据预设的识别标示提取所述静态链接中的单字节字符串;
S2’.根据预设的解码方式将所述单字节字符串转换成检索词;
S3’.根据所述检索词生成动态链接。
另一方面,本申请的实施例提供了一种搜索资源静态化的链接编码系统,用于根据预设的检索词生成静态链接,其中,该系统包括:
字符转换装置,用于根据预设的编码方式将所述检索词转换成单字节字符串;以及
静态链接生成装置,用于在所述单字节字符串的头部或尾部添加识别标示后将其作为所述静态链接的path部分。
相应地,本申请的实施例也提供一种搜索资源静态化的链接解码系统,用于当前网站的站内搜索引擎根据外链的静态链接生成动态链接,其中,该系统包括:
字符提取装置,用于根据预设的识别标示提取所述静态链接中的单字节字符串;
字符转换装置,用于根据预设的解码方式将所述单字节字符串转换成检索词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210036735.0/2.html,转载请声明来源钻瓜专利网。