[发明专利]基于增量Q－Learning的学习方法及系统无效

申请号：	200810066627.1	申请日：	2008-04-11
公开（公告）号：	CN101261634A	公开（公告）日：	2008-09-10
发明（设计）人：	叶允明	申请（专利权）人：	哈尔滨工业大学深圳研究生院
主分类号：	G06F17/30	分类号：	G06F17/30;G06N1/00
代理公司：	深圳市科吉华烽知识产权事务所	代理人：	胡吉科
地址：	518055广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于增量Q－Learning的学习方法及系统。所述方法中系统要沿着新爬行页面对应的超链接链路重新计算链路上各个结点函数Q值，根据计算得到的新的函数Q值，系统重新进行函数Q值的离散化，形成新的样本，然后重新训练NB分类器以获得新的Q值分类模型，再利用该新的Q值分类模型为URL队列中的各个候选URL重新计算Q值，最后IQ－Learning算法也要让页面相关度评估器进行增量学习。本发明系统体系结构的创新点在于增加了一个Q－Learning在线样本生成器，它对在线爬行获得的页面进行分析和评价，生成新的正例样本或反例样本，使增量学习成为可能。本发明所述技术有效的提高了主题爬虫的收获率。
搜索关键词：	基于增量 learning 学习方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于增量Q-Learning的学习方法，其特征在于：所述增量Q-Learning学习方法包括步骤：A：将种子站点集合S作为起始爬行URL队列H；B：对初始样本页面集W进行学习；C：从所述起始爬行URL队列H中取Q函数值最高的结点U；D：爬行得到所述节点U对应的页面d；E：将所述页面d加入到已爬行页面集D；F：从所述页面d中解析出新的URL节点集U*；G：将所述URL节点集U*加入到所述起始爬行URL队列H中；H：计算所述页面d的相关度R(d)；I：将所述相关度R(d)沿链接路径进行反馈对其祖先页面重新计算函数Q值；J：使用所述步骤I中所述函数Q值进行重新训练；K：对于待选的URL使用重新训练过的分类器进行函数Q值的估算；L：对所述URL对列中进行基于所述函数Q值的排序。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院，未经哈尔滨工业大学深圳研究生院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810066627.1/，转载请声明来源钻瓜专利网。

上一篇：基于网络处理器的高速安全虚拟专用网通道及其实现方法
下一篇：嵌段共聚物以及热收缩膜的制造方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于增量Q－Learning的学习方法及系统无效

专利文献下载