[发明专利]网络信息服务平台及其基于该平台的搜索服务方法有效

专利信息
申请号: 201210445457.4 申请日: 2012-11-09
公开(公告)号: CN102968465A 公开(公告)日: 2013-03-13
发明(设计)人: 蒋昌俊;陈闳中;闫春钢;丁志军;王鹏伟;孙海春;郭宇 申请(专利权)人: 同济大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海天协和诚知识产权代理事务所 31216 代理人: 叶凤
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种网络信息服务平台及其基于该平台的搜索服务方法,属于一种新的搜索引擎及其面向搜索的交互方法。网络信息服务平台整体架构分成前台和后台两大部分,其特征在于,所述后台架构底层是Hadoop的分布式文件系统,上面搭载HBase数据库,通过Master节点控制网页爬虫、全文索引器、分类器和索引网构建器;所述前台架构底层也为Hadoop分布式文件系统,上面搭载HBase数据库,通过Master节点控制用户需求分析定位器、推荐模块和最终呈现模块。本发明的平台最终给用户呈现的结果是一条信息流程或者一套服务方案而不是单纯的网页链接。
搜索关键词: 网络 信息 服务 平台 及其 基于 搜索 方法
【主权项】:
一种网络信息服务平台,该网络信息服务平台整体架构分成前台和后台两大部分,其特征在于,所述后台架构底层是Hadoop的分布式文件系统,上面搭载HBase数据库,通过Master节点控制网页爬虫、全文索引器、分类器和索引网构建器;所述前台架构底层也为Hadoop分布式文件系统,上面搭载HBase数据库,通过Master节点控制用户需求分析定位器、推荐模块和最终呈现模块;所述后台的任务是通过网络爬虫将互联网上的网页爬取至本地,送入全文索引器中进行倒排索引,生成索引文件存入数据库,然后分类器在逻辑上将网页分到网页类中,之后再由索引网构建器从网页类中获取网页,以这些网页为基础构建整个索引网络;所述的前台的任务就是当用户提出他的需求之后,将其定位到索引网的网页类中,抽取出索引子网并返回匹配到的网页链接;用户可以点击索引子网的网页类节点来选择自己满意的服务流程;所述网络信息服务系统平台,它包括信息收集子系统,该信息收集子系统又包括爬虫和网页特征向量构建器,所述爬虫会将互联网上的网页爬取回来存储在数据库中;所述网页特征向量构建器是通过网页类的标准网页以及网页类名构建出一个能准确表示网页类特性的工具; 它还包括全文索引器,当信息收集子系统将网页信息收集回来并进行特征向量的构建后,送入全文索引器进行倒排索引;它还包括分类器,从数据库中提取出网页信息,并对网页进行分类,并将分类信息返回给数据库;以及信息收集子系统将网页信息收集之后会送入全文索引器进行一个倒排索引,生成的索引文件送入分类器中对每个网页进行分类;它还包括索引网构建器,需要对数据库中所有的网页进行操作,其任务是能够将海量的网页利用分类和网页间的链接关系组织成索引网,信息服务服务系统可以通过使用索引网即可提取出一个个服务流程;它还包括数据库,与系统外部进行交互,实时获得信息更新,由分类器和爬虫负责把网页数据写入数据库中;还包括用户需求分析定位器,理解用户输入的信息并将用户的输入信息定位到数据库的基础类中,每个类中都包含有和该类相关的网页;它还包括最终呈现模块,最终各个索引子网匹配到的网页链接和用户点击索引子网形成的服务流程由该呈现模块输出给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210445457.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top