[发明专利]一种基于大数据的科技信息在线推荐方法在审

专利信息
申请号: 201811107445.4 申请日: 2018-09-21
公开(公告)号: CN109636495A 公开(公告)日: 2019-04-16
发明(设计)人: 骆焦煌 申请(专利权)人: 闽南理工学院
主分类号: G06Q30/06 分类号: G06Q30/06;G06F17/27;G06F16/35
代理公司: 厦门致群专利代理事务所(普通合伙) 35224 代理人: 刘兆庆
地址: 362700 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 科技信息 算法模型 用户历史行为数据 用户数据中心 日志采集 大数据 画像 机器学习算法 用户浏览网站 触发事件 访问行为 关系网络 关注信息 深度分析 实时采集 数据基础 图谱分析 行为轨迹 行为数据 学习算法 业务场景 用户关注 用户推荐 用户在线 语义分析 便捷性 算法 标签 分析 采集 优化 制定
【权利要求书】:

1.一种基于大数据的科技信息在线推荐方法,其特征在于,包括以下步骤:

S1、采集历史科技信息数据,进行归类后存储到HDFS文件系统;

S2、利用JS嵌码收集用户历史行为数据,并存储到HDFS文件系统,所述历史行为数据包括用户浏览网站时的浏览区域内容、停留时间及Ajax;

S3、基于用户历史行为数据,对用户进行打标签,获得用户数据中心;

S4、利用深度学习算法、机器学习算法及语义分析算法对用户数据中心进行深度分析,并制定推荐算法模型;

S5、利用JS嵌码实时采集用户在线行为数据,根据用户浏览网站过程中的触发事件,利用推荐算法模型为用户推荐相应的科技信息,所述在线行为数据包括用户浏览网站时的点击操作、浏览区域及Ajax;

S6、利用SDK方式对用户的访问行为进行日志采集,并基于日志采集结果对推荐算法模型进行分析优化。

2.如权利要求1所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S1包括以下分步骤:

S11、预先建立聚类特征集,所述聚类特征集包括一组命名实体以及与每个命名实体对应的特征信息知识库;

S12、采集历史科技信息数据,对历史科技信息数据进行中文分词并提取关键词,得到关键词数据集;

S13、以关键词作为基础特征,采用k-means算法进行聚类,得到聚类集;

S14、根据聚类集与聚类特征集的主题相关性,对历史科技信息数据进行数据源归类;

S15、根据聚类特征集与关键词数据集的相关性,提取相应的结构化数据集,获得对历史科技信息数据对应的索引文件;

S16、将历史科技信息数据及其对应的索引文件存储到HDFS文件系统。

3.如权利要求2所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S2包括以下分步骤:

S21、用户浏览网站时,执行嵌套在网站页面中的JS代码;

S22、JS代码通过事件或时间触发,将需要获取的用户行为数据以avro的方式发送到Flume监听端口;

S23、Flume监听端口监听到端口有数据输入时,将其作为用户历史行为数据存储到HDFS文件系统。

4.如权利要求3所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S3包括以下分步骤:

S31、对用户历史行为数据进行清洗、转换及加载,得到目标行为数据;

S32、基于目标行为数据对用户进行打标签,获得用户数据中心。

5.如权利要求4所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S4包括以下分步骤:

S41、对已经打好标签的用户进行画像分析,获得关注信息画像结果;

S42、采用图数据库和力导图的可视化技术,还原出用户的关注行为轨迹关系网络;

S43、在关注信息画像结果、关注行为轨迹关系网络的基础上结合推荐场景制定推荐算法模型。

6.如权利要求5所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S5包括以下分步骤:

S51、利用JS嵌码实时采集用户在线行为数据,并存储到HDFS文件系统;

S52、针对用户在线行为数据进行聚类分析,获取触发事件;

S53、将触发事件发送给STORM引擎,STORM引擎执行推荐算法模型,实现在线推荐。

7.如权利要求6所述的一种基于大数据的科技信息在线推荐方法,其特征在于,所述步骤S6包括以下分步骤:

S61、利用SDK方式对用户的访问行为进行日志采集;

S62、针对用户在线行为数据进行聚类分析,获取触发事件;

S63、利用SDK方式对用户的访问行为进行日志采集,并基于日志采集结果对推荐算法模型进行分析优化。

8.如权利要求1所述的一种基于大数据的科技信息在线推荐方法,其特征在于:所述HDFS文件系统上存储有HBASE数据库和Solrcloud索引。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽南理工学院,未经闽南理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811107445.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top