[发明专利]网络小说介绍页的提取方法及装置在审

专利信息
申请号: 201210389911.9 申请日: 2012-10-15
公开(公告)号: CN103729370A 公开(公告)日: 2014-04-16
发明(设计)人: 蔡兵;朱章厚;徐羽 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 胡海国
地址: 518044 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络小说 介绍 提取 方法 装置
【说明书】:

技术领域

发明涉及移动互联网技术领域,尤其涉及一种网络小说介绍页的提取方法及装置。

背景技术

目前,随着互联网的发展,网络小说的WWW页面呈井喷式增长;而随着移动互联网的快速发展,使用手机上网阅读小说的用户也越来越多。但是,由于WWW页面主要用于PC端浏览,其页面复杂且包含较多无关信息,无法直接展示于手机侧。因此如何将WWW网页结构化,并为移动阅读用户提供优质清爽的阅读体验是目前急需解决的一大难题。

此外,为了方便用户阅读,各小说网站设置有相应的小说介绍页,提供给用户进行选择阅读,小说介绍页是一种描述网络小说主要信息的页面。如:http://www.qidian.com/Book/2342810.aspx。

由于小说介绍页面比较复杂,且各网页风格不一,因此目前主要采用类似XPATH的模板技术进行网站适配,并提取相应字段。

但是,这种模板技术的缺陷在于一次只能适配一个网站,想要覆盖所有小说网站,则人工成本太高;另外一般较大网站都会经常更新,而网站更新会导致模板技术失效,由此增加了人工维护成本。

发明内容

本发明的主要目的在于提供一种网络小说介绍页的提取方法及装置,旨在精简网络小说介绍页的内容,实现网络小说在移动终端上的有效浏览,降低成本。

为了达到上述目的,本发明提出一种网络小说介绍页的提取方法,包括:

对小说介绍页进行网页分块,根据网页分块结果识别出二级导航块以及小说介绍信息块;

基于识别出的所述二级导航块以及小说介绍信息块从所述小说介绍页中提取小说介绍性字段。

本发明还提出一种网络小说介绍页的提取装置,包括:

识别模块,用于对小说介绍页进行网页分块,根据网页分块结果识别出二级导航块以及小说介绍信息块;

提取模块,用于基于识别出的所述二级导航块以及小说介绍信息块从所述小说介绍页中提取小说介绍性字段。

本发明提出的一种网络小说介绍页的提取方法及装置,将复杂的网络小说介绍页进行结构化,提取其中核心的介绍性字段,从而精简网络小说介绍页的内容,为小说描述及用户浏览提供了便利,尤其实现了网络小说在移动终端上的有效浏览。

附图说明

图1是本发明网络小说介绍页的提取方法较佳实施例的流程示意图;

图2是本发明网络小说介绍页的提取方法较佳实施例中一种网络小说介绍页分块后的效果示意图。

图3是图2中的小说介绍页根据提取的介绍性字段重新排版后效果示意图;

图4是本发明网络小说介绍页的提取装置第一实施例的结构示意图;

图5是本发明网络小说介绍页的提取装置第二实施例的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

以下将结合附图及实施例,对实现发明目的的技术方案作详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的主要解决技术方案是:对小说介绍页进行网页分块,将复杂的网络小说介绍页进行结构化,提取其中核心的介绍性字段,为小说描述及用户浏览提供便利。

如图1所示,本发明较佳实施例提出的一种网络小说介绍页的提取方法,包括:

步骤S101,对小说介绍页进行网页分块,根据网页分块结果识别出二级导航块以及小说介绍信息块;

为了实现对网络小说介绍页的智能提取,首先对小说介绍页进行网页分块,网页分块技术在现有技术中已有成熟方案,在此不再赘述。

通过网页分块技术识别出小说介绍页中的二级导航块以及小说介绍信息块,以便根据识别出的小说介绍页中的二级导航块以及小说介绍信息块提取小说介绍页中的核心介绍性字段。

如图2所示,图2是本实施例中一种网络小说介绍页分块后的效果示意图。

图2中每一个线条框表示一个独立的块,针对每个独立块,需要识别其中的二级导航块和小说介绍信息块。其中:

二级导航块,单独成行,且含有诸如”>”、”>”、 →、”您的位置”等导航性符号。图2中框A即为二级导航块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210389911.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top