[发明专利]信息聚类方法、系统、服务器及计算机可读存储介质有效
申请号: | 201811097837.7 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109271555B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 黄河;彭思涵 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/78 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 方法 系统 服务器 计算机 可读 存储 介质 | ||
本发明提供了一种信息聚类方法、系统、服务器及计算机可读存储介质。信息聚类方法,包括以下步骤:S100:获取一历史时间内目标信息的时间访问数据及地域访问数据,以形成输入数据样本;S200:对每一目标信息的初始数据特征降维至具有一特征范围的二维数据特征;S300:在二维尺度下分割特征范围,以将二维数据特征划分至多个聚类;S400:提取聚类中的二维数据特征,并对提取的二维数据特征升维至初始数据特征,以形成输出数据样本;S500:分析输出数据样本的地域访问特征及时间访问特征,以获取对信息的地域访问偏好及时间访问规律。采用上述技术方案后,可通过对海量信息的处理,获取时间维度及地域维度上用户的使用习惯,以进一步分析用户的访问偏好。
技术领域
本发明涉及数据处理与控制领域,尤其涉及一种信息聚类方法、系统、服务器及计算机可读存储介质。
背景技术
随着智能终端的快速发展,用户使用智能终端进行各类的信息处理和分类,及接收已聚类的数据成为了常见的交互手段,甚至对于不少运行在智能终端上的应用程序而言,是否可以根据用户的使用习惯、交互习惯和喜好对信息分类,已成为用户选择是否使用该应用程序的关键因素。
如当用户使用流媒体播放类的应用程序时,为方便用户找到喜好接收的流媒体,应用程序运营商常对不同信息类型的视频作划分和标签,而对视频的划分标准,当前通常以视频的内容,或是以用户自行给出的标签作划分。上述划分方式,更易方便用户查找视频内容。而对于应用程序的运营商而言,很难从这些划分标准中准确地分析出观看某些视频的用户规律,继而较难地向用户推广与用户喜好有关的其他视频。
因此,需要一种新型的信息聚类方法,可方便运营商从大数据中了解用户的使用规律,更为精准地推广近似的信息,增加用户的消费点。
发明内容
为了克服上述技术缺陷,本发明的目的在于提供一种信息聚类方法、系统、服务器及计算机可读存储介质,可通过对海量信息的处理,获取时间维度及地域维度上用户的使用习惯,以进一步分析用户的访问偏好。
本发明公开了一种信息聚类方法,包括以下步骤:
S100:获取一历史时间内目标信息的时间访问数据及地域访问数据,以形成输入数据样本;
S200:对每一目标信息的初始数据特征降维至具有一特征范围的二维数据特征;
S300:在二维尺度下分割所述特征范围,以将所述二维数据特征划分至多个聚类;
S400:提取所述聚类中的二维数据特征,并对提取的二维数据特征升维至所述初始数据特征,以形成输出数据样本;
S500:分析所述输出数据样本的地域访问特征及时间访问特征,以获取对所述信息的地域访问偏好及时间访问规律。
优选地,所述步骤S100包括:
S110:获取历史时间为t天内,n个视频信息在m个地区的访问数据,作为时间访问数据及地域访问数据;
S120:形成n*t*m个输入数据样本。
优选地,步骤S110中,t=15,m=34;步骤S120中计算的输入数据样本为n*15*34个。
优选地,所述步骤S200包括:
S210:对于每一视频信息的初始数据,基于:
Ln=tanh(wn·Ln-1+bn)
逐层降维至具有一特征范围的二维数据特征,其中n为第n层,wn为权重,bn为偏差,tanh()为激活函数,所述特征范围为(-1,1)。
优选地,所述步骤S400包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811097837.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能视频识别系统及其应用
- 下一篇:用于输出信息的方法和装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置