[发明专利]一种基于深度神经网络的影评网站用户的属性预测方法有效
申请号: | 201810524543.1 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108829763B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 屈鸿;刘永胜;房展;舒扬;杨舰;邓悟;季江舟;张晓敏 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 影评 网站 用户 属性 预测 方法 | ||
本发明公开了一种基于深度神经网络的影评网站用户的属性预测方法,属于数据挖掘、机器学习等领域。本发明对影评网站中稀疏的用户评分数据进行矩阵分解,将用户评分矩阵分解为用户‑特征矩阵和电影‑特征矩阵,利用这两个矩阵对用户向量进行部分填充,填充后的用户评分数据作为用户的特征向量。将用户的特征向量数据输入全连接的深度神经网络,结合多任务学习技术,对网络模型进行训练,得到各个任务的标签分数;根据各个任务标签分数进行决策分析,得到最终分类结果。本发明通过深度神经网络技术,对影评网站用户进行自动的属性预测,解决了数据稀疏性问题,具有较高的分类准确率和效率。
技术领域
一种基于深度神经网络的影评网站用户的属性预测方法,用于根据影评预测各属性-人们对电影的喜好程度,属于数据挖掘、深度学习、矩阵分解等技术领域。
背景技术
深度学习源于人工神经网络,可以借助现代神经学的思想,模拟生物大脑神经元结构和机理,搭建人工神经网络模型。深度学习是在网络的输入层和输出层之间建立多个隐藏层,构成复杂的神经网络,通过对样本数据的无标签或有标签的学习优化并调整网络之间的参数,解决回归后分类问题。
深度学习的本质是构建多层的神经网络模型从海量的数据中学习有用的特征,对样本数据进行精确的分类或预测。和浅层学习不同,深度学习有更加深层的网络结构,通过对数据特征的逐层变换,将训练数据在原空间的特征表示变换为表达能力更强的新空间,实现更加准确的分类。特征学习是深度学习中的重要环节。
其基本思想为:对于一个有n层网络的系统S:(S1,S2,...Sn),I表示网络的输入,O表示网络的输出,具体网络结构为:若最终目的是使输入和输出相等,那么为了使O尽可能的接近I,每对网络的参数进行调整,就能得到I的一些列层次特征S1,S2,...Sn。网络中的每一层的输出作为下一层的输入,以实现输入数据的分级表达。
矩阵分解是个性化推荐领域中重要的技术,矩阵分解算法的数学理论基础是矩阵的行和列的变换。矩阵分解基于的思想是:每一个用户和每一个物品都有自己独有的特性,用矩阵分解技术可以从用户对项目的评分矩阵中分解出用户-特性矩阵和物品-特性矩阵,这样就可以仅仅从评分数据中直接得到用户的偏好特征和每件物品的特性,同时还得到特征矩阵的维度。
例如,在电影网站中,每个观影用户对于电影都有自己的偏好,这些偏好可以直观理解成用户喜欢的类型:励志,喜剧,动作,科幻等。用户-特性矩阵表示的就是用户对这些潜在因素的喜欢程度,用户越喜欢这种类型的电影,矩阵中相应的值就越大。同理,每一部电影也可以用这些特性因素描述,因此特性-物品矩阵表示每一部电影中这些因素的权重大小,即电影的类型。如果电影是偏某种类型的题材,矩阵中对这些题材所映射到的相应的值也越大。这样用户-特性矩阵与特性-物品矩阵想成就会得到用户-物品矩阵,矩阵中对应的每一个值表示某个用户对某个电影的喜欢程度。
然而,由于每一个用户只对少部分的电影进行打分,这就造成了评分矩阵的极其稀疏,因此传统的矩阵分解技术不能完成矩阵的分解。通常使用的方法是使用已经存在的评分计算出预测误差,然后使用随机梯度下降法或最小二乘法调整参数使得误差最小,最终得到用户对电影的预测评分。
传统的机器学习中的分类回归等算法都是通过输入样本的特征预测单一属性的类别或数值。即在统一的模型下得到一个学习函数的单任务学习方法,这种情况下训练集中的样本得到的仅仅是单个任务的信息。在对用户属性的实际研究应用过程中,往往需要对不止一个属性进行预测,这些属性之间通常会有一定的关联性。很多研究已经证明,将一些关联性比较大的属性预测任务同时学习,在学习的过程中各个任务之间共享一定的相关信息,学习得到的模型可以取得更好的学习效果。而现有的多任务学习方法大多是用多个类别的联合概率分布来实现的,对于具有多个标签数量和类别数量的样本的预测都有一定的局限性。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810524543.1/2.html,转载请声明来源钻瓜专利网。