[发明专利]数据处理系统中的自动配对选择方法和装置有效
申请号: | 201110400345.2 | 申请日: | 2011-12-06 |
公开(公告)号: | CN103150595A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 佘锡伟;谭志远;杜嘉辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张晓峰;宋志强 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理系统 中的 自动 配对 选择 方法 装置 | ||
1.一种数据处理系统中的自动配对选择方法,其特征在于,包括:
A、接受针对用户的配对请求;
B、检测所述用户当前时刻的状态信息,利用预设的增强学习函数中的状态与配对对象类型选择概率的映射关系,计算用户当前时刻的状态信息对应的不同配对对象类型的选中概率;
C、根据所述选中概率选择一种配对对象;
D、检测用户对所选的配对对象的反应动作信息,根据所获取的反应动作信息对所述增强学习函数中的相应状态与相应配对对象类型选择概率进行反馈修正。
2.根据权利要求1所述的方法,其特征在于,所述增强学习函数中的状态与配对对象类型选择概率的映射关系具体由逼近函数学习器存储。
3.根据权利要求2所述的方法,其特征在于,所述逼近函数学习器为后向传播神经网络。
4.根据权利要求1所述的方法,其特征在于,该方法进一步包括:
先针对指定范围内的所有用户的配对请求,使用同一个增强学习函数执行所述步骤A至步骤D;
在对所有配对对象类型的选择概率的反馈修正次数超过预设的阈值后,将所述增强学习函数分别拷贝给所述指定范围内的每一位用户;不同的用户发出配对请求后,使用该用户对应的增强学习函数执行所述步骤A至步骤D。
5.根据权利要求1所述的方法,其特征在于,所述配对请求为匿名通信系统中的匿名通信请求,所述配对对象类型为匿名通信系统中的通信对象类型;所述步骤C具体包括:根据所述选中概率选择一种通信对象类型,并从中选择通信对象与所述发起配对请求的用户配对,在该通信对象与所述用户之间建立通信;
或者,所述配对请求为即时通信系统或社交网络系统中的好友推荐请求,所述配对对象类型为即时通信系统或社交网络系统中的用户类型;所述步骤C具体包括:根据所述选中概率选择一种用户类型,并从中选择用户作为好友推荐给所述发起配对请求的用户;
或者,所述配对请求为电子商务平台系统中的商品推荐请求,所述配对对象类型为电子商务平台系统中的商品类型;所述步骤C具体包括:根据所述选中概率选择一种商品类型,并从中选择商品作为推荐商品推荐给所述发起配对请求的用户;
或者,所述配对请求为网络博客系统或文学网络系统中的文章推荐请求,所述配对对象类型为文章类型;所述步骤C具体包括:根据所述选中概率选择一种文章类型,并从中选择文章作为推荐文章推荐给所述发起配对请求的用户。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述增强学习函数为Q学习函数,该Q学习函数中的状态与配对对象类型的选择概率为对应的Q值。
7.根据权利要求6所述的方法,其特征在于,步骤B具体包括:
检测所述用户的当前时刻的状态信息st;
将所述用户的状态信息输入到Q学习函数中,根据Q学习函数中的状态与配对对象类型Q值的映射关系,得到在状态st下的每种配对对象类型对应的Q值Q(st,a);
根据公式计算每种配对对象类型的选中概率;
其中,所述ai为第i个配对对象类型,所述p(st,ai)为在st状态下配对对象类型ai对应的选中概率,Q(st,ai)为在st状态下配对对象类型ai对应的Q值,e为自然对数,所述τ为模拟退火因子,A为所有配对对象类型的集合。
8.根据权利要求7所述的方法,其特征在于,在得到配对对象类型对应的Q值之后,进一步包括:将该Q值乘以一外部的干预系数,得到阈值移动Q值,以该阈值移动Q值作为相应配对对象类型的Q值计算该配对对象类型的选中概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110400345.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带式输送机拉紧装置用加强型改向绳轮机构
- 下一篇:在线式视觉跟踪方法