[发明专利]基于网络爬虫以及大数据分析的用户获利信息推送方法有效
申请号: | 201810409419.0 | 申请日: | 2018-05-02 |
公开(公告)号: | CN108549727B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 韩景倜;梁贺君;李超然;任上 | 申请(专利权)人: | 上海财经大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 爬虫 以及 数据 分析 用户 获利 信息 推送 方法 | ||
为提供一种既能实现对符合条件的用户推送获利信息,又能够保证信息全面性的用户获利信息推送方法,本发明提供了一种基于网络爬虫以及大数据分析的用户获利信息推送方法,包括如下步骤:步骤S1,获取用户的用户信息;步骤S2,对用户信息进行文本分析得到反映条件特征;步骤S3,根据条件特征对用户进行分类得到不同的用户分类;步骤S4,利用网络爬虫从多个信息发布网站上获取获利信息;步骤S5,对获利信息进行文本分析得出不同的获利信息所对应的获利条件;步骤S6,根据条件特征以及的获利条件得出用户分类与获利信息的匹配程度;步骤S7,根据与获利信息之间的匹配程度向用户分类中的用户推送获利信息。
技术领域
本发明涉及一种信息推送方法,具体涉及一种基于网络爬虫以及大数据分析的用户获利信息推送方法。
背景技术
现代社会是信息爆炸的社会,而如何从大量信息中获取与自身利益相关的信息从而获利则是目前的互联网用户关注较多的问题,例如,为了提升客流量,餐饮店经常在不同的网站上发布符合特定条件(例如持有高校学生证或某银行信用卡等)即可在限定时间内获得折扣的信息,当用户获知该信息并且自身条件符合时即可获得折扣;又例如,为了促进科技发展,政府机构通常会向符合条件的科技型企业提供资金或政策方面的支持等。
然而,由于上述与用户获取的利益相关的获利信息通常会分散发布在不同的网站上(例如,本地信息发布网站,银行优惠信息发布页面或者不同政府机构网站的公告页面等等),用户几乎无法自主、全面地获得这些信息。一些网站会在筛选后向条件匹配的用户主动推送信息,但这种推送的范围仅限于登录并浏览了该网站的用户,其他用户则无法获得推送而不能得知该网站上的获利信息。
为了提升信息的全面性,一些网站还采用了获取其他多个网站发布的获利信息并进行展示的方式,使得用户能够浏览并从这些信息中找到有用的获利信息。然而,这样的方式又导致了信息量过大,导致用户不得不花费大量时间进行浏览和筛选。此外,由于这样的网站中获利信息量巨大、用户的条件信息也极为复杂,因此筛选和条件匹配机制也难以有效实现。
发明内容
为解决上述问题,提供一种既能实现对符合条件的用户推送获利信息,又能够保证信息全面性的用户获利信息推送方法,本发明采用了如下技术方案:
本发明提供了一种基于网络爬虫以及大数据分析的用户获利信息推送方法,用于向根据用户信息向不同的用户推送对应的获利信息,其特征在于,包括如下步骤:步骤S1,获取用户的用户信息;步骤S2,依次对用户信息进行文本分析,分别得到反映各个用户的获利条件的多个条件特征;步骤S3,根据条件特征对用户进行分类,从而得到不同的用户分类;步骤S4,利用网络爬虫从多个与用户获利相关联的信息发布网站上获取与获利相关的获利信息;步骤S5,对获利信息进行文本分析,得出不同的获利信息所对应的获利条件;步骤S6,根据与用户分类相对应的条件特征以及与获利信息对应的获利条件得出用户分类与获利信息的匹配程度;步骤S7,根据与获利信息之间的匹配程度向用户分类中的用户推送获利信息。
本发明提供的基于网络爬虫以及大数据分析的用户获利信息推送方法,还可以具有这样的技术特征,其中,步骤S3包括如下步骤:步骤S3-1,将条件特征形成与用户相对应的特征向量;步骤S3-2,基于特征向量对用户进行聚类;步骤S3-3,依次获取每类用户的用户标签。
本发明提供的基于网络爬虫以及大数据分析的用户获利信息推送方法,还可以具有这样的技术特征,其中,步骤S3-2的聚类采用基于社区发现的聚类算法进行。
本发明提供的基于网络爬虫以及大数据分析的用户获利信息推送方法,还可以具有这样的技术特征,其中,步骤S5包括如下步骤:步骤S5-1,对获利信息进行数据清洗从而去除其中的无效信息;步骤S5-2,对清洗后的获利信息进行文本分析,得出每个获利信息所包含的获利条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海财经大学,未经上海财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810409419.0/2.html,转载请声明来源钻瓜专利网。