[发明专利]一种基于智能搜索的福富企业搜索引擎技术无效
| 申请号: | 201010550786.6 | 申请日: | 2010-11-19 |
| 公开(公告)号: | CN102004775A | 公开(公告)日: | 2011-04-06 |
| 发明(设计)人: | 黄震奇;江勇;林乐然;罗志伟;陈华光 | 申请(专利权)人: | 福建富士通信息软件有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 350013 福建*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种基于智能搜索的福富企业搜索引擎技术将企业内部、外部数据统一于同一平台,搜索不同来源地数据信息,支持结构化数据和半结构化数据。首先使用不同的数据采集方式搜集各类信息,对于采集到的信息对象,先要进行一定的智能处理,然后再建立索引;之后,将在搜索引擎的中心数据库中进行统一的存储管理,该系统具备强大的结构化、非结构化和半结构化信息的处理和检索能力,它是整个搜索引擎的数据仓储中心,也是整个搜索引擎的检索动力核心。系统根据用户输入的关键词,采用基于词库的中文分词技术,根据其适用领域设计了一个混合型正向最大匹配算法,来处理分词中的歧义,为加快分词过程中词的查找速度,按首字索引结构对词典进行了组织。搜索结果根据预先设定的权重进行排序,包含高权重分词的结果排在低权重分词结果的前面,为企业提供高效的搜索信息功能。 | ||
| 搜索关键词: | 一种 基于 智能 搜索 企业 搜索引擎 技术 | ||
【主权项】:
一种基于智能搜索的福富企业搜索引擎技术,其特征在于:1)福富企业搜索引擎引入了数据网关来实现各类关系数据库与搜索引擎中心数据库之间的数据关联和同步。数据网关包含文档格式分析和文档格式标签过滤模块,该模块对关系型数据库中的文件内容进行分析并存储到中心数据库。2)数据采集结束后,搜索引擎根据预先设置的索引策略对这些数据进行索引,以便在后续提供高效、准确的全文检索服务;对于采集到的网页等信息对象,先要进行一定的智能处理,然后再建立索引。3)采用基于词库的中文分词技术,设计一个混合型正向最大匹配算法,该算法利用规则及字频信息来处理分词中的歧义,按首字索引结构对词典进行了组织,加快分词过程中词的查找速度。4)建立中心数据库,中心数据库在这一阶段的工作可以分为以下几个主要步骤:●中心数据库的创建和配置●数据的装入及控制5)智能管理,搜索系统采集提供基于浏览器的完善的管理功能。能够对系统运行状态、系统硬件资源的使用情况、对服务器进程的启、停等进行监控。同时可通过词典管理对全文数据库中的检索词典进行维护。6)对于企业现用或新建的系统,如MIS系统提供耦合接口,实现对数据资源的挖掘,供门户网站或其它应用系统使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建富士通信息软件有限公司,未经福建富士通信息软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010550786.6/,转载请声明来源钻瓜专利网。





