[发明专利]一种基于大数据的三维素材推荐方法在审
申请号: | 201711446479.1 | 申请日: | 2017-12-27 |
公开(公告)号: | CN110020168A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 张一;唐兴波;陈忠会;李刚 | 申请(专利权)人: | 艾迪普(北京)文化科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100101 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 马尔科夫模型 采样位置 概率向量 可变 构建 素材 线性组合 用户推荐 大数据 概率 三维 归一化处理 离散型分布 操作记录 历史轨迹 数据集中 线性回归 移动对象 用户浏览 浏览记录 整合 集合 采集 预测 全局 | ||
1.一种基于大数据的三维素材推荐方法,其特征在于,该方法包括:
采集历史浏览记录并构建全阶可变马尔科夫模型:先确定当前时间,从现在的时间起计算,采集时间阈值的T范围内的用户历史浏览记录,确定各个采样位置的数据集中概率,进行归一化处理,确定各个离散型分布概率,构建全阶可变马尔科夫模型;
形成个体马尔科夫模型:根据每个移动对象的历史轨迹,构建0阶马尔科夫模型和可变阶马尔科夫模型,进行数据的整合,形成每个用户的个体马尔科夫模型;
生成概率向量线性组合:通过线性回归将全局马尔科夫模型和个体马尔科夫模型进行组合,生成概率向量线性组合;
确定采样位置并向用户推荐素材:给定训练浏览记录的集合,根据马尔科夫模型概率向量计算采样位置概率并预测下一个采样位置,该采样位置就是向用户推荐的素材。
2.根据权利要求1所述的方法,其特征在于,所述时间阈值T的确定步骤如下:
1)先确定当前时间和当前产品的关系:是否时间在系统设定的特殊事件范围内;
2)确定当前产品的类型,如果产品类型,是和时间相关的,则时间阈值的步长就是按照特殊时间的步长来确定;如果不相关,则时间阈值的步长就按照正常范围获取。
3.根据权利要求1所述的方法,其特征在于,构建全阶可变马尔科夫模型的步骤为:
a)构建采样位置的前缀集合;
b)对于前缀集合中每一个前缀,计算数据集中每个不同的采样位置出现在这个前缀之后的频率,进行归一化处理,得到一个关于下一个采样位置的离散型概率分布;
c)从1阶开始,依次开始训练,得到可变阶的全局马尔科夫模型。
4.根据权利要求1所述的方法,其特征在于,形成个体马尔科夫模型的具体步骤为:
i)将每个用户在所述时间阈值T内的长度大于1的浏览记录训练一个可变阶的马尔科夫模型:每个用户使用它自己的浏览记录构建前缀集合,计算下一个采样位置的概率分布,通过将阶数从1变化到N来迭代训练可变阶的马尔科夫模型;
ii)对于每个用户,使用它自己的记录单元训练一个0阶马尔科夫模型,计算用户在每个采样位置的出现概率;
iii)将0阶马尔科夫模型和可变阶马尔科夫模型整合在一起生成最终的个体马尔科夫模型。
5.根据权利要求1所述的方法,其特征在于,生成概率向量线性组合的步骤为:
1’)分别使用概率向量来表示全局马尔科夫模型和个体马尔科夫模型的浏览记录序列的所有采样位置成为下一个采样位置的概率;
2’)构建浏览记录序列的指示向量,使真正的实际下个位置处的向量值为1,其他为0;
3’)将全局马尔科夫模型和个体马尔科夫模型的概率向量进行线性组合。全局马尔科夫模型和个体马尔科夫模型的概率向量组合后为:
其中,1是单位向量,β0,β1和β2是需要估计的系数。
6.根据权利要求1所述的方法,其特征在于,确定采样位置并向用户推荐的素材的步骤具体为:
给定一个包含n条训练浏览记录的集合,通过标准线性回归最小化来计算βi的最优值,当w=1时,代表全局马尔科夫模型的概率向量,w=2时代表个体马尔科夫模型的概率向量,其中m表示采样位置的数目,表示位置j成为下一个采样位置的概率,进一步的,对于特定的轨迹,通过标记估计量中的k个最大元素来预测top-k个下一采样位置,这些采样位置就是向用户推荐的素材。
7.根据权利要求1所述的方法,其特征在于,所述采样位置为:对于一个给定的用户,它通过一组采样位置,其中每个采样位置指的是记录的浏览的素材,对应地,在三维素材系统中,用户浏览一个素材的记录,就可以视作一个采样位置,该采样位置除了包括时间、浏览的素材以外,还包括浏览的入口。
8.根据权利要求1所述的方法,其特征在于,在每个所述素材中包含有时间戳,该时间戳对应时事类型,对应年度时事,那么时间序列会以每年这个时间节点为中心取序列,则这取的轨迹是按照事件类型来取的。
9.根据权利要求1所述的方法,其特征在于,候选的所述采样位置通过每个用户的浏览行为习惯来计算,计算方法包括:
A)按照类型浏览的习惯,则候选位置是按照类型来列举出下一个候选位置;
B)按照标签搜索来查找素材,则给定候选素材,在其他用户行为中搜索这个标签之后,浏览的素材作为候选的下一位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾迪普(北京)文化科技股份有限公司,未经艾迪普(北京)文化科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711446479.1/1.html,转载请声明来源钻瓜专利网。