[发明专利]一种基于潜在狄利克雷分配模型的潜在特征提取方法在审
申请号: | 201710273587.7 | 申请日: | 2017-04-24 |
公开(公告)号: | CN107133730A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 王宝亮;王宇琛 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06;G06F17/27 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 潜在 狄利克雷 分配 模型 特征 提取 方法 | ||
技术领域
本发明涉及一种用于推荐系统的特征提取方法。
背景技术
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己需要的商品。这种浏览大量无关信息和产品的过程,无疑会使消费者淹没在信息过载问题中,从而不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐是根据用户的特点和行为,向用户推荐其感兴趣的信息和商品。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
目前,推荐系统有着非常广泛的应用,除了亚马逊,淘宝等电商网站,如今日头条的新闻推荐,云 OS的手机app推荐,网易云音乐的音乐推荐,以及其他很多应用场景中,都使用到了推荐系统。
个性化推荐系统中,当用户到来之后,推荐系统需要为用户生成特征,然后对每个特征找到有相似特征的物品,从而最终生成用户的推荐列表。因而,推荐系统的核心任务就被拆分成两部分,一个是如何为给定的用户生成特征,另一个是如何提取出已知商品的特征,进而实现用户与商品的特征匹配,完成推荐。
发明内容
本发明提供一种用于推荐系统的特征提取方法。本发明将潜在狄利克雷分配模型运用到推荐算法中,将用户对商品所打的标签、购买记录构成商品的向量,进而运用潜在狄利克雷分配模型提取商品的潜在特征。技术方案如下:
一种基于潜在狄利克雷分配模型的隐特征提取方法,包括下列步骤:
(1)选取一段时间内用户对商品的评分,以及这些用户对这些商品的标签,用户好友关系信息和用户的自身特性作为数据集;
(2)从数据集提取出不同用户对同一商品的标签置于同一商品下,并且按商品热度由零开始将数据集重新排列,重新定义商品ID;
(3)随机地为潜在狄利克雷分配模型向量θd和赋初始值,参数θd的含义为标签集合中的每个标签集合d,对应不同潜在特征的概率θd<pt1,pt2,...pti,...pt25>,其中,pti表示d对应潜在特征集T中第i 个潜在特征的概率,参数的含义为对每个潜在特征集T中的潜在特征t,生成不同标签的概率其中,pwi表示t第i个标签的概率;
(4)针对一个特定商品的标签集合ds中的第i个标签wi,令该标签对应的潜在特征为tj,得到标签集合的中出现标签wi的概率;
(5)枚举T中的潜在特征,得到所有的pj(wj|ds),即在标签集合ds中出现第j个标签wj的概率;然后可以根据这些概率值结果,取令pj(wi|ds)最大的tj为ds中的第i个标签wi为其潜在特征;
(6)如果ds中的第i个标签wj此时选择了一个与原先不同的潜在特征,根据向量θd和的计算公式,会对θd和产生反馈,更新参数,迭代公式如下:
然后将θd与带入Gibbs Sampling公式中,通过求解出主题分布和词分布的后验分布,从而成功解决主题分布和词分布这两参数未知的问题,完成一次迭代;
其中,αk与βt分别为未知的主题分布超参数和词分布超参数,Gibbs Sampling;
(7)重复执行(4)-(6)步骤,对每个标签按照Gibbs Sampling公式重新采样得到潜在特征,在标签库中更新,直到Gibbs Sampling输出收敛,此收敛值即为潜在狄利克雷分配模型的最终输出值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710273587.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于物流园区的车辆调度系统
- 下一篇:一种梯级泵站调水工程甩站优化调度方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理