[发明专利]多线程分析网页资料的系统及方法无效
申请号: | 200610200848.4 | 申请日: | 2006-09-06 |
公开(公告)号: | CN101140578A | 公开(公告)日: | 2008-03-12 |
发明(设计)人: | 李忠一;叶建发;卢秋桦;陈旭纯 | 申请(专利权)人: | 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518109广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种多线程分析网页资料的方法,其特征在于,该方法包括如下步骤:下载所需分析的网页,并将该网页保存至下载网页资料库;将该网页内容格式转换为可扩展标记语言格式;判断网页分析规则库中是否有与该网页内容相应的分析规则;若网页分析规则库中有相应的分析规则,则根据所述分析规则对该网页内容进行分析;判断是否对分析后网页内容进行评估;若所述分析规则中有对网页内容的限定时,则对分析后的网页内容进行评估;判断分析后的网页内容是否符合评估要求;若分析后的网页内容符合评估要求,则将所述评估后的网页内容保存至分析网页资料库。利用本发明可以能快速、有效地萃取所需浏览网页中的信息。 | ||
搜索关键词: | 多线程 分析 网页 资料 系统 方法 | ||
【主权项】:
1.一种多线程分析网页资料的系统,包括应用服务器、网页分析规则库、下载网页资料库及分析网页资料库,其特征在于,所述应用服务器包括:下载模块,用于下载所需分析的网页,并将该网页保存至下载网页资料库;转换模块,用于将网页内容格式转换为可扩展标记语言格式;判断模块,用于根据该可扩展标记语言格式内容结点判断所述网页分析规则库中是否有与该网页内容相应的分析规则,根据所述分析规则中是否有对网页内容的限定判断是否对分析后的网页内容进行评估,及根据所述分析规则中的限定判断所述分析后的网页内容是否符合评估要求;分析模块,用于当所述网页分析规则库中有与该网页内容相应的分析规则时,根据所述分析规则对网页内容进行分析,及当所述分析规则中有对网页内容的限定时,对分析后的网页内容进行评估;储存模块,用于将符合评估要求的网页内容保存至分析网页资料库;及反馈模块,用于当分析后的网页内容不符合评估要求时,将该分析规则反馈到网页分析规则库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司,未经鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610200848.4/,转载请声明来源钻瓜专利网。
- 上一篇:散热器固定装置
- 下一篇:耶尔森氏菌属物种的多肽及其使用方法