[发明专利]挖掘电视观看模式的数据处理系统及方法有效
申请号: | 201210164390.7 | 申请日: | 2012-05-23 |
公开(公告)号: | CN103425698B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 汪灏泓;董延平 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙)44268 | 代理人: | 刘文求 |
地址: | 516001 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 挖掘 电视 观看 模式 数据处理系统 方法 | ||
1.一种挖掘电视观看模式的数据处理系统,其特征在于,包括
数据收集模块,用于收集电视节目的观看历史数据;
数据过滤模块,用于从数据收集模块收集的电视节目的观看历史数据中过滤识别出用户的观看历史数据,将噪声数据滤除;
数据挖掘与特征分类模块,用于通过对存储有用户观看历史和电视节目信息的内容数据库进行数据挖掘与数据特征分类,找出用户的观看信息,并将特征分类后的用户观看信息形成一个聚类集;
分析模块,用于分析用户观看历史内容特征和从数据挖掘与特征分类模块获取到的聚类集,从中选择分类,获取代表原始用户行为内容历史的观看历史数据集;
模式挖掘模块,用于从分析模块获取的观看历史数据集中发掘出用户观看模式集;
所述模式集中模式数量与分类数量相关,将所述观看历史数据集用时间带划分的方法进行分类,将一个完整的时间划分成若干个时间带,时间带的划分由家庭来确定,不同的家庭时间带划分不同;
其中,所述模式挖掘模块包括:
用户观看模式分析模块,用于将所述观看历史数据集进行数学模型化,生成用户的观看历史数据集,并对观看历史数据集进行重新架构;
对比模块,用于对比观看历史数据集和用户观看模式分析模块重新架构的观看历史数据集,找出最优的用户观看模式组合。
2.一种挖掘电视观看模式的数据处理方法,其特征在于,包括以下步骤:
A、数据收集模块预先收集电视节目的观看历史数据,并通过数据过滤模块从中过滤识别出用户的观看历史数据,滤掉噪声数据;
B、数据挖掘与特征分类模块通过对存储有用户观看历史和电视节目信息的内容数据库进行数据挖掘与数据特征分类,找出用户的观看信息,并将特征分类后的用户观看信息形成一个聚类集;
C、分析模块通过分析用户观看历史内容特征和从上一步获取到的聚类集,从中选择分类,获取代表原始用户行为内容历史的观看历史数据集;
D、模式挖掘模块从分析模块获取的观看历史数据集中发掘出用户观看模式集;所述模式集中模式数量与分类数量相关,将所述观看历史数据集用时间带划分的方法进行分类,将一个完整的时间划分成若干个时间带,时间带的划分由家庭来确定,不同的家庭时间带划分不同;模式挖掘模块对所述观看历史数据集进行重新架构,通过对比观看历史数据集和重新架构的观看历史数据集,确定最优的用户观看模式集,并输出。
3.根据权利要求2所述的挖掘电视观看模式的数据处理方法,其特征在于,所述步骤D具体包括:
D1、将所述观看历史数据集进行如下定义:
指定N为用户特定的时间段的长度,{Vi}(i=0,1,…,N-1)是第i个时间点观看历史数据集;
将用户观看模式定义为P(c,s,n,m,p),其中,c表示内容类别,s表示用户观看模式开始时间点,且s∈{0,1,…,N-1};n是用户观看行为发生周期的长度,且n∈{1,2,…,N/2};m表示周期重复次数,且m∈{1,…,N/n};p表示模式字符串长度,且p∈{1,…,n};
定义{Pr(c,s,n,m,p)}(r=0,1,…,R-1)为用户观看模式的结果集,并通过所述结果集对观看历史数据集进行重新架构,结果定义为其中,R表示从历史数据中找出来的具有代表性的模式数量;
D2、对比观看历史数据集{Vi}和重新架构的观看历史数据集找出差异最小的并通过确定最优的用户观看模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210164390.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型安全节能环保蒸炉专用炉头
- 下一篇:一种新型经济炉排