[发明专利]基于OWL语义分析的定向采集系统无效
申请号: | 201110285068.5 | 申请日: | 2011-09-23 |
公开(公告)号: | CN102346772A | 公开(公告)日: | 2012-02-08 |
发明(设计)人: | 王楠 | 申请(专利权)人: | 王楠 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210006 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于OWL语义分析的定向采集系统,其包括采集配置客户端、任务调度管理模块、定向采集执行端和采集数据管理模块,所述采集配置客户端根据用户设定输出采集主题和初始URL,并将所述初始URL保存在URL种子数据库中,其特征在于:所述定向采集执行端采集所述URL种子数据库中所有URL对应的网页,并将其输出到所述任务调度管理模块,所述任务调度管理模块对该网页进行OWL本体实例转换后获取其中所有的与所述采集主题相关的URL,并将其保存到所述URL种子数据库中。相比传统的定向采集系统,本发明的基于OWL语义分析的定向采集系统充分利用OWL的先进思想,先去读懂网页中的内容,然后在从中提取真正需要采集的内容。其具有精度高、智能化等优点。 | ||
搜索关键词: | 基于 owl 语义 分析 定向 采集 系统 | ||
【主权项】:
基于OWL语义分析的定向采集系统,其包括采集配置客户端、任务调度管理模块、定向采集执行端和采集数据管理模块,所述采集配置客户端根据用户设定输出采集主题和初始URL,并将所述初始URL保存在URL种子数据库中,其特征在于:所述定向采集执行端采集所述URL种子数据库中所有URL对应的网页,并将其输出到所述任务调度管理模块和采集数据管理模块,所述任务调度管理模块对该网页进行OWL本体实例转换后获取其中所有的与所述采集主题相关的URL,并将其保存到所述URL种子数据库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王楠,未经王楠许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110285068.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种热处理工艺曲线的绘制方法
- 下一篇:一种带有风扇功能的笔记本电脑适配器