[发明专利]一种预测图片流行度的方法及系统有效
申请号: | 201710848297.0 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107563394B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 刘文印;司徒润威;李六武;高俊艳;杨振国 | 申请(专利权)人: | 奇秦科技(北京)股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100094 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 图片 流行 方法 系统 | ||
本申请公开了一种预测图片流行度的方法,方法包括:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度;该方法能够准确预测图片的流行度,有利于新媒体的发展;本申请还公开了一种预测图片流行度的系统、一种计算机可读存储介质及服务器,具有以上有益效果。
技术领域
本发明涉及数据分析领域,特别涉及一种预测图片流行度的方法、系统和一种计算机可读存储介质及服务器。
背景技术
信息技术的飞速发展推动了社交媒体的流行,社交媒体改变了人们交互的方式。用户主要通过发送图片的方式,在社交媒体平台分享自己的生活和经历。因此,社交媒体积累了海量的图片数据。然而,这些图片的流行度不尽相同。不同知名度的用户所发的图片的流行度相差甚远,同一用户发的图片的流行度也不同。许多领域的应用,例如新闻个性化推荐系统的设计,网上广告的投放等等,都得益于社交媒体图片流行度预测这一课题研究。
现有技术中,基于循环神经网络的社交网络消息爆发检测是对社交网络中用户发布与转发的历史消息的分类预测,判断消息是否爆发。该现有技术只涉及到对社交媒体上面的文本信息的预测,无法实现对社交图片流行度的精准预测。
因此,如何实现对社交图片流行度进行精准预测,是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种预测图片流行度的方法、系统和一种计算机可读存储介质及服务器,能够实现对社交图片流行度进行精准预测。
为解决上述技术问题,本申请提供一种预测图片流行度的方法,该方法包括:
将采集到的图片数据进行预处理得到待分析数据;
利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;
利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。
可选的,所述将采集到的图片数据进行预处理得到待分析数据包括:
根据社交线索特征将采集到的图片数据划分为时间特征数据和非时间特征数据;
利用多时态标度的方法对所述时间特征数据进行处理得到待分析时间数据;
利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据;
其中,所述待分析数据包括所述待分析时间数据和所述待分析非时间数据。
可选的,所述利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据包括:
根据函数对所述非时间特征数据的取值范围进行区间划分;其中,b0、b1…bi-1为映射值;ai为第i个所述区间上的所述非时间特征数据的取值;
根据所述非时间特征数据确定对应区间上的映射值,并通过get_dummies函数进行相应转化得到待分析非时间数据。
可选的,根据所述非时间特征数据确定对应区间上的映射值包括:
在所述区间中设置重叠区间,判断所述非时间特征数据是否落在所述重叠区间;
若是,则判定所述非时间特征数据对应的所述区间为所述重叠区间相邻的区间;
若否,则对所述非时间特征数据的映射值确定对应区间上的映射值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇秦科技(北京)股份有限公司,未经奇秦科技(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710848297.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:登录验证方法及装置
- 下一篇:通过智能镜子进行着装管理的方法和装置