[发明专利]基于增量Q-Learning的学习方法及系统无效
申请号: | 200810066627.1 | 申请日: | 2008-04-11 |
公开(公告)号: | CN101261634A | 公开(公告)日: | 2008-09-10 |
发明(设计)人: | 叶允明 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N1/00 |
代理公司: | 深圳市科吉华烽知识产权事务所 | 代理人: | 胡吉科 |
地址: | 518055广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于增量Q-Learning的学习方法及系统。所述方法中系统要沿着新爬行页面对应的超链接链路重新计算链路上各个结点函数Q值,根据计算得到的新的函数Q值,系统重新进行函数Q值的离散化,形成新的样本,然后重新训练NB分类器以获得新的Q值分类模型,再利用该新的Q值分类模型为URL队列中的各个候选URL重新计算Q值,最后IQ-Learning算法也要让页面相关度评估器进行增量学习。本发明系统体系结构的创新点在于增加了一个Q-Learning在线样本生成器,它对在线爬行获得的页面进行分析和评价,生成新的正例样本或反例样本,使增量学习成为可能。本发明所述技术有效的提高了主题爬虫的收获率。 | ||
搜索关键词: | 基于 增量 learning 学习方法 系统 | ||
【主权项】:
1.一种基于增量Q-Learning的学习方法,其特征在于:所述增量Q-Learning学习方法包括步骤:A:将种子站点集合S作为起始爬行URL队列H;B:对初始样本页面集W进行学习;C:从所述起始爬行URL队列H中取Q函数值最高的结点U;D:爬行得到所述节点U对应的页面d;E:将所述页面d加入到已爬行页面集D;F:从所述页面d中解析出新的URL节点集U*;G:将所述URL节点集U*加入到所述起始爬行URL队列H中;H:计算所述页面d的相关度R(d);I:将所述相关度R(d)沿链接路径进行反馈对其祖先页面重新计算函数Q值;J:使用所述步骤I中所述函数Q值进行重新训练;K:对于待选的URL使用重新训练过的分类器进行函数Q值的估算;L:对所述URL对列中进行基于所述函数Q值的排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810066627.1/,转载请声明来源钻瓜专利网。