[发明专利]基于用户习惯的小说推荐方法及系统有效
申请号: | 202210427059.3 | 申请日: | 2022-04-21 |
公开(公告)号: | CN114780844B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 吴鲲;李志烨 | 申请(专利权)人: | 杭州樱熊网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 杭州信与义专利代理有限公司 33450 | 代理人: | 马育妙 |
地址: | 310000 浙江省杭州市钱*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 习惯 小说 推荐 方法 系统 | ||
1.一种基于用户习惯的小说推荐方法,其特征在于,包括步骤:
S1,获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户在每个历史阅读时段阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取待进行小说推荐的时间点所属的阅读时段;
S2,在关联所述用户的所述小说推荐过滤词库中进一步获取关联待进行小说推荐的所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
S3,将可推荐的所述小说库中的每篇小说的类型对应的类型词与关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S4;
若匹配失败,则转入步骤S4;
S4,将经步骤S3过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词与关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S5;
若匹配失败,则转入步骤S5;
S5,将经步骤S4过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词与关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S6;
若否,则转入步骤S6;
S6,对步骤S1获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并将经步骤S5过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
S7,计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
S8,对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接后,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
S9,对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个所述第二拼接结果分别对应的第二编码结果;
S10,计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(1)计算所述第一编码结果与每个所述第二编码结果的相似度frs:
公式(1)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
S11,判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在待进行小说推荐的所述时间点待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
S12,判断所述第一小说集中的数据是否为空,
若是,则将步骤S5过滤剩余的所述小说库中的小说加入到第二小说集中,然后转入步骤S13;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说,然后转入步骤S13;
S13,对步骤S1获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容分别对应的第三分词结果,并对所述第一小说集中或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
S14,对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
S15,将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
S16,通过以下公式(2)计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab:
公式(2)中,表示所述第四句向量中的第b个词向量的转置;
va表示第三句向量中的第a个词向量;
S17,通过以下公式(3)计算所述第三句向量与所述第四句向量之间的相关性per′ab:
公式(3)中,la、lb分别表示所述第三句向量和所述第四句向量中的词向量的数量;
S18,判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小说作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
S19,判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州樱熊网络科技有限公司,未经杭州樱熊网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210427059.3/1.html,转载请声明来源钻瓜专利网。