[发明专利]自主发布信息的网络服务中检查信息内容的方法和装置无效
| 申请号: | 200810036423.3 | 申请日: | 2008-04-22 |
| 公开(公告)号: | CN101261630A | 公开(公告)日: | 2008-09-10 |
| 发明(设计)人: | 郭诺 | 申请(专利权)人: | 郭诺 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈亮 |
| 地址: | 200235上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自主 发布 信息 网络服务 检查 信息内容 方法 装置 | ||
1、一种在自主发布信息的网络服务中检查信息内容的方法,包括:
(1)对指定网站的所有网页或新增网页进行全站范围的自动爬行扫描;
(2)根据设定的检索策略检查网页内容,获取符合该检索策略的设定要求的内容/页面地址;
(3)将符合该检索策略的设定要求的内容/页面地址以预先设定的可选择的方式上报。
2、根据权利要求1所述的在自主发布信息的网络服务中检查信息内容的方法,其特征在于,在步骤(2)中,该检索策略包括对基于文本网页进行关键字和表达式匹配的检查、对基于特定文件格式标志进行发现的匹配检查、对图像图片文件进行特定类型的图像识别的检查、对人类语言进行语意机器自动识别的匹配检查中的任意一种组合。
3、根据权利要求1所述的在自主发布信息的网络服务中检查信息内容的方法,其特征在于,步骤(3)中该预先设定的可选择的方式包括Email上报、电话上报、手机上报、即时通号码上报。
4、根据权利要求1所述的在自主发布信息的网络服务中检查信息内容的方法,其特征在于,步骤(1)和(2)进一步包括:
(a)根据限定的时间特性条件判断是否符合周期间隔或特定时间的控制条件,如果符合条件则进入步骤(b);
(b)动态装填准备接受扫描的页面URL队列;
(c)判断在该页面URL队列中是否还有可扫描的URL对象,如果有可扫描的URL对象则提取出其中一个URL对象,否则直接转入步骤(3);
(d)建立连接并通过头连接判断URL对象的页面文件可用性的基本信息,如果基本信息符合设定的可检测条件则继续下一步,否则将该URL对象标记为错误并记入错误队列;
(e)进行网页内容实体下载和初步状态性检查,如果检查结果符合则继续分析网页内容,否则将该URL对象标记为错误并记入错误队列;
(f)分析网页的内容实体,进行URL检查分析以及根据设定的检索策略的检查,其中URL检查分析过程包括将可用的URL装填入待分析的URL队列,不符检查条件的URL做抛弃标记并记入错误队列;
(g)在被检查的URL页面文件是不包含URL信息的二进制类型文件时仅执行检索策略的检查,包括对内容实体进行检索策略的匹配比对,当发现触发该检索策略的问题时将URL做标记并记入待报警的URL队列,同时将当前页面URL做水印标记、检查时间标记和状态标记。
5、一种自主发布信息的网络服务中检查信息内容的装置,包括:
全站自动爬行扫描模块,对指定网站的所有网页或新增网页进行全站范围的自动爬行扫描;
检索策略检查模块,按照设定的检索策略检查网页内容,获取符合该检索策略设定要求的内容/页面地址;
可选择上报模块,将符合该检索策略所触发的内容/页面地址以预先设定的可选择的方式进行上报。
6、根据权利要求5所述的自主发布信息的网络服务中检查信息内容的装置,其特征在于,该检索策略检查模块中设定的检索策略包括对基于文本网页进行关键字和表达式匹配的检查、对基于特定文件格式标志进行发现的匹配检查、对图像图片文件进行特定类型的图像识别的检查、对人类语言进行语意机器自动识别的匹配检查中的任意一种组合。
7、根据权利要求5所述的自主发布信息的网络服务中检查信息内容的装置,其特征在于,该可选择上报模块包括Email上报单元、电话上报单元、手机上报单元、即时通号码上报单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郭诺,未经郭诺许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810036423.3/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





