[发明专利]一种网页模板生成方法及装置在审
申请号: | 201610074217.6 | 申请日: | 2010-08-20 |
公开(公告)号: | CN105786972A | 公开(公告)日: | 2016-07-20 |
发明(设计)人: | 郑清芳;章动;鲍东山 | 申请(专利权)人: | 北京新岸线移动多媒体技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网页模板生成方法,包括:获取预定数量的网页地址等同目录下的网页;将所述网页切分成若干切分块,计算所述各切分块的特征值;将计算得到的所述特征值进行统计;将重复出现次数多于预设阈值的特征值保存到特征值库,作为模板部分的特征值。本发明还提供相应的装置。根据本发明能基于已有网页生成适配的网页模版,所生成的模板能够很好的体现网页的内容,在用于网页解析时,能够只对网页中真正的内容部分进行解析,从而减少垃圾信息的干扰,提高网页分析的准确度和精确度,明显提高网页分析的效果。 | ||
搜索关键词: | 一种 网页 模板 生成 方法 装置 | ||
【主权项】:
一种网页模板生成的方法,其特征在于,包括如下步骤:获取预定数量的网页地址等同目录下的网页;将所述网页切分成若干切分块,计算所述各切分块的特征值;将计算得到的所述特征值进行统计;将重复出现次数多于预设阈值的特征值保存到特征值库,作为模板部分的特征值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新岸线移动多媒体技术有限公司,未经北京新岸线移动多媒体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610074217.6/,转载请声明来源钻瓜专利网。