[发明专利]一种基于标签分级的资讯召回排序方法、装置和设备在审
申请号: | 202111523770.0 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114201652A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 吴晨 | 申请(专利权)人: | 宁波深擎信息科技有限公司;上海深擎信息科技有限公司 |
主分类号: | G06F16/9038 | 分类号: | G06F16/9038 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 李杨 |
地址: | 315000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 分级 资讯 召回 排序 方法 装置 设备 | ||
1.一种基于标签分级的资讯召回排序方法,其特征在于,所述方法包括:
获取预设时间段内的用户行为日志数据,根据所述用户行为日志数据得到用户画像标签,将所述用户画像标签输入到预先训练好的逻辑回归模型中,得到用户画像分级标签;所述用户画像分级标签包括用户画像主体标签和用户画像辅助标签;所述用户画像辅助标签为所述用户画像分级标签中非资讯主体的标签;所述用户画像主体标签为所述用户画像分级标签中的其他标签;
获取原始资讯,从所述原始资讯中提取带有权重信息的资讯画像标签;
在资讯召回阶段,根据所述用户画像主体标签和所述资讯画像标签从所述原始资讯中获取候选资讯集;
在资讯排序阶段,根据所述用户画像主体标签、所述用户画像辅助标签和所述资讯画像标签,得到用户与所述候选资讯集中每条资讯的相关度值,根据所述相关度值对所述候选资讯集中的资讯进行排序。
2.根据权利要求1所述的方法,其特征在于,获取原始资讯,从所述原始资讯中提取带有权重信息的资讯画像标签,包括:
获取原始资讯;
通过Hanlp算法对所述原始资讯进行分词得到资讯标签;
通过TextRank算法对分词后的资讯进行处理,得到所述资讯标签的权重信息;
根据所述资讯标签和所述资讯标签的权重信息得到带有权重信息的资讯画像标签。
3.根据权利要求2所述的方法,其特征在于,在资讯排序阶段,根据所述用户画像主体标签、所述用户画像辅助标签和所述资讯画像标签,得到用户与所述候选资讯集中每条资讯的相关度值,包括:
在资讯排序阶段,分别获取所述用户画像主体标签的权重和所述用户画像辅助标签的权重;
获取所述资讯画像标签的权重;
根据所述用户画像主体标签的权重、所述用户画像辅助标签的权重和所述资讯画像标签的权重,得到用户与所述候选资讯集中每条资讯的相关度值为:
其中,Ruser,news为用户与候选资讯集中每条资讯的相关度值,为用户画像主体标签或用户画像辅助标签的权重,为资讯画像标签的权重,O为用户与资讯交集标签数量,N为资讯画像标签总数量。
4.根据权利要求3所述的方法,其特征在于,根据所述相关度值对所述候选资讯集中的资讯进行排序,包括:
根据所述相关度值对所述候选资讯集中的资讯进行排序,对相关度值高的资讯优先推送给所述用户。
5.根据权利要求1所述的方法,其特征在于,所述资讯为财经资讯、视频资讯或营销图片资讯。
6.根据权利要求5所述的方法,其特征在于,当所述资讯为财经资讯时,所述用户画像辅助标签为所述用户画像分级标签中非投资标的的标签。
7.根据权利要求6所述的方法,其特征在于,所述用户画像辅助标签为在一年中超2个月标签打出率超5%,且标签打出率分布在所有标签中排名前3%的标签。
8.一种基于标签分级的资讯召回排序装置,其特征在于,所述装置包括:
用户画像模块,用于获取预设时间段内的用户行为日志数据,根据所述用户行为日志数据得到用户画像标签,将所述用户画像标签输入到预先训练好的逻辑回归模型中,得到用户画像分级标签;所述用户画像分级标签包括用户画像主体标签和用户画像辅助标签;所述用户画像辅助标签为所述用户画像分级标签中非资讯主体的标签;所述用户画像主体标签为所述用户画像分级标签中的其他标签;
资讯画像模块,用于获取原始资讯,从所述原始资讯中提取带有权重信息的资讯画像标签;
资讯召回模块,用于在资讯召回阶段,根据所述用户画像主体标签和所述资讯画像标签从所述原始资讯中获取候选资讯集;
资讯排序模块,用于在资讯排序阶段,根据所述用户画像主体标签、所述用户画像辅助标签和所述资讯画像标签,得到用户与所述候选资讯集中每条资讯的相关度值,根据所述相关度值对所述候选资讯集中的资讯进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波深擎信息科技有限公司;上海深擎信息科技有限公司,未经宁波深擎信息科技有限公司;上海深擎信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111523770.0/1.html,转载请声明来源钻瓜专利网。