[发明专利]视频服务网站内容更新信息的自动搜索与抽取系统及方法有效
申请号: | 200910160626.8 | 申请日: | 2009-07-17 |
公开(公告)号: | CN101599089A | 公开(公告)日: | 2009-12-09 |
发明(设计)人: | 朱明;易荣锋 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市立方律师事务所 | 代理人: | 张 磊 |
地址: | 230026*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种视频服务网站内容更新信息的自动搜索与抽取系统,包括系统调度模块、URL组装机构造模块、xpath生成器、URL生成模块、网页下载模块、信息抽取模块和信息存储数据库。其中,系统调度模块用于协调和调度各个系统模块;URL组装机构造模块用于构造当前进行信息抽取的网站搜索结果页URL的组装机;xpath生成器用于生成搜索结果页各视频摘要信息所在子树顶节点的xpath;URL生成模块用于使用URL组装机组装搜索结果页的URL;网页下载模块用于下载指定URL的网页;信息抽取模块用于抽取下载网页的视频摘要信息,并存储到信息存储数据库;信息存储数据库用于存储抽取下来的摘要信息。本发明有效地解决了网站内容更新信息的获取问题。 | ||
搜索关键词: | 视频 服务 网站 内容 更新 信息 自动 搜索 抽取 系统 方法 | ||
【主权项】:
1、一种视频服务网站内容更新信息的自动搜索与抽取系统,包括系统调度模块、URL(统一资源定位器)组装机构造模块、xpath(XML文档元素路径)生成器、URL生成模块、网页下载模块、信息抽取模块和信息存储数据库,所述系统调度模块,用于协调和调度各个系统模块;所述URL组装机构造模块,用于构造当前进行信息抽取的网站搜索结果页URL的URL组装机;所述xpath生成器,用于生成所述搜索结果页各视频摘要信息所在子树顶节点的xpath;所述URL生成模块,用于利用所述URL组装机组装所述搜索结果页的URL;所述网页下载模块,用于下载所述指定URL的网页;所述信息抽取模块,用于从下载的所述搜索结果页中抽取视频摘要信息,并存储到所述信息存储数据库;所述信息存储数据库,用于存储所述抽取下来的视频摘要信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910160626.8/,转载请声明来源钻瓜专利网。
- 上一篇:多供电回路自动转换装置
- 下一篇:一种实现图片搜索的方法及装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法