[发明专利]一种文本消息检测算法和基于该算法的个性化网络消息发布监视方法无效

专利信息
申请号: 200710040025.4 申请日: 2007-04-26
公开(公告)号: CN101296219A 公开(公告)日: 2008-10-29
发明(设计)人: 朱佳亭 申请(专利权)人: 上海市静安区教育学院附属学校
主分类号: H04L29/06 分类号: H04L29/06;H04L12/54;G06F17/30
代理公司: 上海天翔知识产权代理有限公司 代理人: 刘粉宝
地址: 200040*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种文本消息检测算法以及基于该算法的个性化网络消息发布监视方法。其文本消息检测算法主要包括获取代表文本内容的源代码、比较文本消息内容和提取新发布消息的标题等步骤。其监视方法是根据用户所关注的网站,定时对指定的网页进行检测,监视其消息的发布,并及时向用户提示。用户把所要关注的网页地址设置到监视器中,如果有新消息发布,监视器会自动弹出提示窗口,并让用户浏览所关注的最新消息发布的内容。
搜索关键词: 一种 文本 消息 检测 算法 基于 个性化 网络 发布 监视 方法
【主权项】:
1、文本消息检测算法,其特征在于是基于http协议控件而实现的,具体包括如下步骤:(1).获取代表文本内容的代码a.从源代码文件中去掉CDATA区域内的所有代码,即从“<![CDATA[”开始到“]]>”结束;b.将源代码中的所有标签中的英文字母转换成小写字母,即从“<”开始到“>”结束;c.去掉描述显示风格的代码,即从“”结束;d.去掉脚本代码,即从“”结束;e.去掉注释标签,即从“<!--”开始到“-->”结束;f.去掉剩下来的所有标签,这样便得到了代表文本内容的源代码;(2).比对文本消息内容a.从经步骤(1)处理后的源代码中去掉阿拉伯数字0-9;b.去掉中文“一”到“十”这十个字获得网页代码文件;c.经过上述处理得到的网页代码文件可用于检测文本消息的发布;如果当前网页的代码与保存在本地的代码经上述处理后发现有不一致的地方,则说明在当前网页上很可能有新消息发布。将当前网页代码中不同于保存在本地的网页代码的那部分内容纪录下来,并暂时保存起来。d.如果连续测到第三步中暂时保存的内容没有变化,那么这部分内容就属于新发布的消息;否则有可能是一些随机产生的文本信息;(3).提取新发布消息的标题a.在步骤(1)获取文本消息源代码的过程中,将标签外夹在标签与标签之间的内容作为候选消息的内容保存下来,这样一来保存下来的文本信息全是由这样一条条候选消息组成的文件,每一条候选消息占一行。b.在步骤(2)的比对文本消息过程中也就是对候选消息进行比对,并记录下新发现的候选消息的行号;c.根据该行号选出候选消息,作为监测到的新消息的标题;候选消息的内容与步骤(2)中的c步骤暂时保存的文本代码不完全相同;d.从这条候选消息中将一些特殊的符号替换成可显示的格式,以得到完整的可显示的文本消息的标题;e.将文本消息的标题转换成软件控件可显示的代码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市静安区教育学院附属学校,未经上海市静安区教育学院附属学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200710040025.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top