[发明专利]私有云搜索系统及其实现方法无效
申请号: | 201110275528.6 | 申请日: | 2011-09-16 |
公开(公告)号: | CN102323955A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 邹春城 | 申请(专利权)人: | 邹春城 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 刘淑敏 |
地址: | 436032 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种私有云搜索系统及其实现方法,该系统主要包括浏览器、网页结构分析记忆模块和数据过滤筛选模块;所述浏览器中,还包括人工浏览网页模块和/或机器浏览网页模块。通过网页结构分析记忆模块实现用户自定搜索范围,搜索条件设置等,能够使一个非常繁杂的计算的前期准备工作,从操作上变得简单,通过利用机器浏览网页模块抓取需要的网页,最后利用数据过滤筛选模块对网页代码进行结构分割和多关键词的搜索,从而实现语义块判断、过滤和筛选,再保存到数据库中实现不同网站相似内容的聚合。在现有浏览器中应用本发明的系统及方法,可以实现个性化的针对性搜索,提高搜索精准度和提高搜索效率。 | ||
搜索关键词: | 私有 搜索 系统 及其 实现 方法 | ||
【主权项】:
一种私有云搜索系统,包括浏览器,其特征在于,该私有云搜索系统还包括网页结构分析记忆模块和数据过滤筛选模块;所述浏览器中,进一步包括人工浏览网页模块和机器浏览网页模块,或者仅包括机器浏览网页模块;其中:机器浏览网页模块,用于根据搜索的广度在选择的网址范围内抓取网页,或根据有无搜索关键字,选取不同的搜索链接,根据查询模板生成搜索请求和抓取网页,并根据搜索结果设定搜索深度;网页结构分析记忆模块,根据需要提取网页上的本站链接、站外链接、本站图片链接并分类保存到数据库中;用于判断网页上的是否有填充表单、表单如何设计组织,并根据用户需要输出能反映表单设计内容的字串记录,并根据需要保存到数据库中;提供人工辅助提取当前网页上的网址并分类筛选网址功能,保存到数据库中;自动提取鼠标点击位置处的网址链接,以及在提交网页请求时,记录提交请求的数据格式;数据过滤筛选模块,根据行业信息的特点,设定数据筛选条件和关键字集;分析网页代码特征分割代码,提取文字段落;根据文字段落和多关键字查询,实现语义块有效性判断;以及根据有效性大小,筛选保存数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邹春城,未经邹春城许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110275528.6/,转载请声明来源钻瓜专利网。
- 上一篇:牛仔服装面料
- 下一篇:磺酸盐滤渣回收处理系统