[发明专利]一种站点资源管理方法及装置无效
| 申请号: | 201210592976.3 | 申请日: | 2012-12-31 |
| 公开(公告)号: | CN103218390A | 公开(公告)日: | 2013-07-24 |
| 发明(设计)人: | 崔建伟;王佳;李伟刚 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 站点 资源管理 方法 装置 | ||
1.一种站点资源管理方法,其特征在于,包括以下步骤:
对web站点进行数据挖掘以获取所述web站点中各个页面的URL数据;
对所述各个页面的URL数据进行语义分析以获取各个页面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征属于训练得到的多个TAG特征和多个Mypos特征;以及
根据各个页面的TAG特征和Mypos特征得到所述各个页面在预定分类表的各个分类下的权重。
2.根据权利要求1所述的方法,其特征在于,进一步包括步骤:
根据所述各个页面在预定分类表的各个分类下的权重将所述各个页面输出给对应的聚合频道。
3.根据权利要求1所述的方法,其特征在于,进一步包括步骤:
根据所述各个页面在预定分类表的各个分类下的权重计算所述各个页面的相似度以进行相似页面推荐。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述预定分类表的各个分类包括篮球、足球、网球、其他体育、财经、女性、娱乐、军事、国际时事、社会、美食、汽车、旅游、科技、健康、两性、笑话、动漫或游戏。
5.根据权利要求1至3中任一项所述的方法,其特征在于,对web站点进行数据挖掘以获取所述web站点中各个页面的URL数据的步骤包括:
对所述web站点进行日志挖掘和站点挖掘,其中通过所述日志挖掘获取页面的URL数据以及所述页面的访问热度,通过所述站点挖掘获取所述站点下各个页面的URL数据以及站点结构数据。
6.根据权利要求5所述的方法,其特征在于,所述访问热度用于确定页面的点击量,所述站点结构数据用于实现web站点至web app的结构转换。
7.根据权利要求1至3中任一项所述的方法,其特征在于,对所述各个页面的URL数据进行语义分析以获取各个页面的TAG特征和Mypos特征的步骤包括:
对所述各个页面的URL数据进行切词分析以得到多个词;
将所述多个词与训练得到的多个TAG特征和多个Mypos特征进行匹配以获取各个页面的TAG特征和Mypos特征。
8.一种站点资源管理装置,其特征在于,包括:
挖掘模块,用于对web站点进行数据挖掘以获取所述web站点中各个页面的URL数据;
特征获取模块,用于对所述各个页面的URL数据进行语义分析以获取各个页面的TAG特征和Mypos特征,其中所述TAG特征和所述Mypos特征属于训练得到的多个TAG特征和多个Mypos特征;以及
权重计算模块,用于根据各个页面的TAG特征和Mypos特征得到所述各个页面在预定分类表的各个分类下的权重。
9.根据权利要求8所述的装置,其特征在于,还进一步包括:
页面分类模块,用于根据所述各个页面在预定分类表的各个分类下的权重将所述各个页面输出给对应的聚合频道。
10.根据权利要求8所述的装置,其特征在于,还进一步包括:
相似度计算模块,用于根据所述各个页面在预定分类表的各个分类下的权重计算所述各个页面的相似度以进行相似页面推荐。
11.根据权利要求8至10中任一项所述的装置,其特征在于,所述预定分类表的各个分类包括篮球、足球、网球、其他体育、财经、女性、娱乐、军事、国际时事、社会、美食、汽车、旅游、科技、健康、两性、笑话、动漫或游戏。
12.根据权利要求8至10中任一项所述的装置,其特征在于,所述挖掘模块包括:
日志挖掘单元,用于获取页面的URL数据以及所述页面的访问热度;
站点挖掘单元,用于获取所述站点下各个页面的URL数据以及站点结构数据。
13.根据权利要求12所述的装置,其特征在于,所述访问热度用于确定页面的点击量,所述站点结构数据用于实现web站点至web app的结构转换。
14.根据权利要求8至10中任一项所述的装置,其特征在于,所述特征获取模块包括:
切词分析单元,用于对所述各个页面的URL数据进行切词分析以得到多个词;
匹配单元,用于将所述多个词与训练得到的多个TAG特征和多个Mypos特征进行匹配以获取各个页面的TAG特征和Mypos特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210592976.3/1.html,转载请声明来源钻瓜专利网。





