[发明专利]一种基于多个数据源的废旧行业搜索系统以及其方法在审
| 申请号: | 201611116560.9 | 申请日: | 2016-12-07 |
| 公开(公告)号: | CN106599153A | 公开(公告)日: | 2017-04-26 |
| 发明(设计)人: | 刘宁;周国辉;王清霞;姜林 | 申请(专利权)人: | 河北中废通网络技术有限公司;北京再塑宝科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/445 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 050031 河北省石家庄市*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据源 废旧 行业 搜索 系统 及其 方法 | ||
1.一种基于多个数据源索引创建的方法,其特征在于,该方法包括:
A、将schema.xml 文件中的常规静态字段定义为多个数据源的模式;
B、初始化solr搜索索引库创建字段;
C、使用solrJ技术操纵CloudSolrClient的流程;
D、索引创建完毕。
2.根据权利要求1所述的基于多个数据源索引创建的方法,其特征在于,所述步骤A具体为:在索引数据初始化时,字符串(string)类型的定义s1、s2、s3、s4、s5等多个数据源,设计示例如下所示:
<field name="s1" type="string" indexed="true" stored="true"/>
<field name="s2" type="string" indexed="true" stored="true"/>
<field name="s3" type="string" indexed="true" stored="true"/>
<field name="s4" type="string" indexed="true" stored="true"/>
<field name="s5" type="string" indexed="true" stored="true"/>
实现了不用重启solrCloud集群,来创建索引节点,进而为用户提供废旧行业搜索服务。
3.根据权利要求1所述的基于多个数据源索引创建的方法,其特征在于,所述的步骤B具体为:key为该条数据的唯一标识:用于商品编号、卖家编号、UUID使用;
s开头的为字符串类型:用于分词搜索匹配使用;
i开头的为整数:用于存储和检索整数类型值;
d开头的为双精度小数:用于存储和检索双精度小数类型值;
t开头的为日期:用于存储和检索日期类型的值;
l开头的为List<String>集合:用于存储和检索多值搜索。
4.根据权利要求1所述的基于多个数据源的索引创建的方法,其特征在于,索引库创建为了提高性能,特不设定自动匹配字段。
5.一种基于多个数据源的废旧行业搜索系统,其特征在于,所述的创建多个数据源的索引针对废旧行业所在的搜索系统而言。
6.根据权利要求5所述的基于多个数据源的废旧行业搜索系统,其特征在于,该系统包含以下几个部分:
数据预处理模块A、数据存储模块B、数据缓存模块C、索引创建模块D、搜索结果展示模块E。
7.根据权利要求5所述的基于多个数据源的废旧行业搜索系统,其特征在于,所述数据预处理模块A,将搜索数据初始化,对搜索请求参数进行预处理包括以下步骤:
A1、对关键词(keyword)进行预处理:如果用户关键词为空直接返回,不循环便利;如果全为特殊字符,返回报错信息(搜索关键词全为特殊字符);如果输入关键词含有特殊字符或者空格,将关键词中的非法字符过滤掉;如果全为数字,将通过append方法拼接封装SolrQuery;如果全为字母,采用pin4j工具类将pinyin和py两个查询字段用append方法拼接封装SolrQuery;进行上述特殊判断处理后,将关键词采用分词器进行拆词,拆词后作为请求参数封装SolrQuery;
A2、将步骤A1处理后的关键词(keyword)、与分类(cagetory)、省份(province)、市(city)、价格(price)等请求参数一起封装SolrQuery;
A3、将创建SearchInfoInput实体类将步骤A2封装的SolrQuery与系统索引分片(partition)一并作为系统的输入数据。
8.根据权利要求5所述的基于多个数据源的废旧行业搜索系统,其特征在于,所述数据缓存模块C,用4个nginx来支持搜索平台服务器、接口专用服务器、价格同步缓存服务器、文件缓存服务器,后台mysql,备份服务器,并搭建了redis集群,缓存商品的价格,库存信息,整个缓存平台支持系统的负载均衡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北中废通网络技术有限公司;北京再塑宝科技有限公司,未经河北中废通网络技术有限公司;北京再塑宝科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611116560.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据缓存方法及系统
- 下一篇:一种产品排名方法





