[发明专利]一种面向青少年群体的个性化内容推荐方法有效
| 申请号: | 201910405862.5 | 申请日: | 2019-05-15 |
| 公开(公告)号: | CN110147497B | 公开(公告)日: | 2020-08-04 |
| 发明(设计)人: | 战科宇 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国栋 |
| 地址: | 102600 北京市大兴*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 青少年 群体 个性化 内容 推荐 方法 | ||
1.一种面向青少年群体的个性化内容推荐方法,其特征在于:包括如下步骤,
S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;
S2、构建神经网络模型;同时结合用户编号、用户年龄、用户性别和用户历史浏览推荐内容的属性,进行隐语义向量化建模,作为用户的兴趣向量;
S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;
S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分;
步骤S2包括如下内容,
S201、将用户编号作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;
S202、将用户年龄作为一个单值离散特征,通过一个嵌入层,转换为64维的数值向量;
S203、将用户性别作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;
S204、将步骤S201、S202和S203中所得到数值向量相连,通过第一全连接层,转换为128维的第一数值向量;
S205、将内容类别作为一个单值离散特征,通过一个嵌入层,转换为32维的数字向量;
S206、将内容展现方式作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;
S207、将内容的标签集合,作为一个多值离散特征,通过一个稀疏嵌入层,并将多值离散特征的转换结果相加,转换为64维的数值向量;
S208、将步骤S205、S206和S207中得到的数值向量相连,通过第二全连接层,转换为128维的第二数值向量;
S209、将第一数值向量和第二数值向量进行内积运算,从而得到神经网络模型;
步骤S4中向用户推荐内容时,对推荐内容进行打分的打分算法如下,
其中,Score为最终的得分;BaseScore为基础分;M是神经网络模型,X'i为第u个用户的特征与第d条内容的特征经预处理后组合成的行为特征;M(X'i)为将X'i作为步骤S209的输入所获取的神经网络模型的计算结果,Threshold为得分阈值;A是模型打分的除权因子;timed是第d条内容的时间;B是时间的除权因子;Shuffle随机打散算法;所述随机打散算法以1为中心,以C为随机幅度;
将所述训练集记为T,所述T表示如下,
T={X1,y1,X2,y2,...,XN,yN}
其中,i=1,2,...,N,N为训练集中行为数据的总数,Xi为训练集中第i个行为数据,yi为训练集中第i个行为数据的反馈结果;
所述Xi如下式所示,
Xi=(uidu,ageu,genderu,cated,typed,{tagd1,tagd2,...,tagdM});
其中,uidu,ageu,genderu为触发第i个行为数据的主体,即第u个用户的特征;cated,typed,{tagd1,tagd2,...,tagdM}为第i个行为数据的客体,即第d条内容的特征;uidu是第u个用户的编号,ageu是第u个用户的年龄,genderu是第u个用户的性别,cated是第d条内容的内容类别,typed是第d条内容的展现方式,tagdj是第d条内容的第j个标签,j=1,2,...,M,M为第d条内容的标签总数;
步骤S3包括如下内容,
S301、将全部的用户编号做成词典,取出训练集中的第一行为数据的用户编号在词典中的索引,得到该用户编号的单值离散特征,并将该单值离散特征作为步骤S201的输入;
S302、针对青少年用户群体,限定用户的年龄区间为0到18,对训练集中的第一个行为数据的用户年龄进行特异值处理,得到该用户年龄的单值离散特征,并将该单值离散特征作为步骤S202的输入;
S303、定义用户性别,包括0-未知、1-男性、2-女性,对训练集中的第一个行为数据的用户性别进行数值化,得到用户形变的单值离散特征,并将其作为步骤S203的输入;
S304、对训练集中的第一个行为数据的内容类别进行数值化,得到该内容类别的单值离散特征,并将该单值离散特征作为步骤S205的输入;
S305、对训练集中的第一个行为数据的内容展现方式进行数值化,得到该内容展现方式的单值离散特征,并将该单值离散特征作为步骤S206的输入;
S306、采用fnv32哈希算法对训练集中第一个行为数据的内容标签集合进行哈希化,得到该内容标签集合的多值离散特征,并将该多值离散特征作为步骤S207的输入;
S307、采用步骤S209中获取的神经网络模型对上述步骤中的离散特征进行计算,得到神经网络模型的计算结果;将获取的神经网络模型的计算结果与训练集中的第一个行为数据的反馈结果求差值,并将该差值作为第一个行为数据的训练误差;
S308、遍历训练集中所有的行为数据,以256条数据为一个批次进行训练,取一个批次的均方误差作为评判结果,并以最小化均方误差结果为优化目标进行优化,从而完成神经网络模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910405862.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:内容推送方法及装置
- 下一篇:一种知识推送方法、装置及存储设备、程序产品





