[发明专利]网页信息的处理方法及浏览器有效
申请号: | 201210474312.7 | 申请日: | 2012-11-21 |
公开(公告)号: | CN103838728B | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 蔡兵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 信息 处理 方法 浏览器 | ||
技术领域
本发明涉及移动互联网领域,特别涉及一种网页信息的处理方法及浏览器。
背景技术
随着移动互联网的快速发展,通过移动终端浏览器浏览网页的用户数量也越来越多。由于移动终端的屏幕尺寸比较小,很难通过浏览器将网页中所有内容进行显示,目前浏览器通过抽取和转码技术可以将网页的正文内容提取出来后进行显示。然而不少网页在正文开头、正文结尾会嵌入无关信息,在网页正文中也会嵌入无关图片,比如在网页正文开头或结尾嵌入声明信息,在网页正文中嵌入广告图片等,影响了浏览器的显示效果。
目前,针对上述问题,各网站通过人工对本网站网页中的相应无关信息进行过滤删除;该种人工过滤删除方法虽然在一定程度上能够将一定的无关信息删除,但是,由于该种方法由人工操作,其过滤的效率较低,成本较高;并且由于不同网站中信息嵌入的方式各不相同,进行人工过滤删除的操作人员只了解本网站网页中信息嵌入的方式,不了解除该网站以外的其他网站网页中信息嵌入的方式,因此该人工过滤方法只能针对某个具体网站进行特殊处理,针对除该网站以外的其他网站中的网页则不适用,造成网页过滤方法的利用率较低。
发明内容
本发明实施例提供一种网页信息的处理方法及浏览器,提高了对网页中无关信息进行过滤的效率,并且提高了网页过滤方法的利用率。
本发明实施例采用的技术方案为:
一种网页信息的处理方法,包括:获取待处理网页的域名,并从所述待处理网页中提取待匹配内容,所述待匹配内容包括以下任一种或多种内容:所述待处理网页正文中位于第一行号前的第一文本、位于第二行号后的第二文本或图片URL;
判断所述待匹配内容是否与所述域名对应的预设过滤规则中的相应信息相同,所述预设过滤规则包括过滤信息中的任一种或多种信息,所述过滤信息包括:第一信息、第二信息或目标图片URL,所述第一信息为所述第一行号和第一目标文本,所述第二信息为所述第二行号和第二目标文本;
如果所述待匹配内容与所述预设过滤规则中的相应信息相同,则对所述待匹配内容进行过滤处理。
一种浏览器,包括:
第一获取单元,用于获取待处理网页的域名;
提取单元,用于从所述待处理网页中提取待匹配内容,所述待匹配内容包括以下任一种或多种内容:所述待处理网页正文中位于第一行号前的第一文本、位于第二行号后的第二文本或图片URL;
判断单元,用于判断所述提取单元提取的待匹配内容是否与所述域名对应的预设过滤规则中的相应信息相同,所述预设过滤规则包括过滤信息中的任一种或多种信息,所述过滤信息包括:第一信息、第二信息或目标图片URL,所述第一信息为所述第一行号和第一目标文本,所述第二信息为所述第二行号和第二目标文本;
过滤单元,用于如果所述判断单元判断所述待匹配内容与所述预设过滤规则中的相应信息相同,则对所述待匹配内容进行过滤处理。
本发明提供的网页信息的处理方法及浏览器,与现有技术中由人工对网页中的无关信息进行过滤删除相比,对网页中的无关信息进行过滤时,是按照与待处理网页的域名对应的过滤信息对待处理网页中的无关信息进行过滤删除,不需要由人工对网页中的无关信息进行过滤删除,提升了过滤效率,降低了成本,并且可以用于对不同网站中的网页进行过滤处理,提升了网页过滤方法的利用率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种网页信息的处理方法流程图;
图2为本发明实施例提供的另一种网页信息的处理方法流程图;
图3为本发明实施例提供的一种浏览器的结构示意图;
图4为本发明实施例提供的另一种浏览器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
本发明实施例提供一种网页信息的处理方法,如图1所示,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210474312.7/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置