[发明专利]挖掘电视观看模式的数据处理系统及方法有效
申请号: | 201210164390.7 | 申请日: | 2012-05-23 |
公开(公告)号: | CN103425698B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 汪灏泓;董延平 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙)44268 | 代理人: | 刘文求 |
地址: | 516001 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 挖掘 电视 观看 模式 数据处理系统 方法 | ||
技术领域
本发明涉及用户观看电视模式的挖掘,尤其涉及的是基于率失真理论的挖掘电视观看模式的数据处理系统及方法。
背景技术
目前,用户习惯在消费品与服务提供方面起到至关重要的作用,而想要推广自己的产品和服务就必须了解使用该产品和服务的用户,针对该问题,现有技术中有很多解决方案,然而这些解决方案都不是很理想,因为用户的行为有很强的确定性因素。此外有些技术方案通过隐性方式研究用户反馈,比如使用用户的程序选择历史或观看历史去发现观看者的偏好,然而这种方式过于简单,不能真正揭示隐藏在用户行为下更深层次的模式。
而在电视领域,对于用户观看模式的挖掘也决定了产品的服务质量,决定了电视产业的发展,由于一个家庭的组成多样化、不同家庭成员观看时间的重叠性特点、不可避免的意外干扰观看记录内容标题之间又存在的微妙联系等等,这些问题使得对用户观看模式的挖掘变得非常困难。
用户观看历史记录中存在很强的自相关性,尤其对于稳定的家庭,在这种家庭中,电视的观看模式更易被发掘。如图1所示,其中圆形、三角和方形代表关键电视节目序列,‘X’代表其他非关键节目,而圆形、方形、三角形所代表的点在一个长时期的统计中呈现出周期反复性的特点。虽然自相关性研究被用于各种各样的数据统计分析之中,像如网络访问、音乐和音频、图像与视频等,但还没有人尝试将这种方式引入电视观看历史学习中。自相关性会被噪声点所掩盖(如不可预料的事)或者同一个家庭的多个模式常常会重叠在一起,而这些都是自相关性引入该领域所要面临的困难。也就是说如何在一个带有噪声的数据中发现模式和如何在用户使用历史相互交叉的记录中分割重叠模式,是现有技术人员所要面临的挑战。
另一方面,在电影、电视节目、新闻、音乐、游戏等等的大量的用户数据中又存在着复杂的互相关联的关系。这些关系又必需在用户电视观看模式挖掘处理过程中予以考虑。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种挖掘电视观看模式的数据处理系统及方法,通过将电视用户观看模式挖掘问题转换为优化问题,并采用率失真理论解决该优化问题,进而挖掘出最优的用户观看行为模式。
本发明解决技术问题所采用的技术方案如下:
一种挖掘电视观看模式的数据处理系统,其中,包括
数据收集模块,用于收集电视节目的观看历史数据;
数据过滤模块,用于从数据收集模块收集的电视节目的观看历史数据中过滤识别出用户的观看历史数据,将噪声数据滤除;
数据挖掘与特征分类模块,用于通过对存储有用户观看历史和电视节目信息的内容数据库进行数据挖掘与数据特征分类,找出用户的观看信息,并将特征分类后的用户观看信息形成一个聚类集;
分析模块,用于分析用户观看历史内容特征和从数据挖掘与特征分类模块获取到的聚类集,从中选择分类,获取代表原始用户行为内容历史的观看历史数据集;
模式挖掘模块,用于从分析模块获取的观看历史数据集中发掘出主要的用户观看模式集。
所述的挖掘电视观看模式的数据处理系统,其中,所述模式挖掘模块包括:
用户观看模式分析模块,用于将所述观看历史数据集进行数学模型化,生成用户的观看历史数据集,并对观看历史数据集进行重新架构;
对比模块,用于对比观看历史数据集和用户观看模式分析模块重新架构的观看历史数据集,找出最优的用户观看模式组合。
一种挖掘电视观看模式的数据处理方法,其中,包括以下步骤:
A、数据收集模块预先收集电视节目的观看历史数据,并通过数据过滤模块从中过滤识别出用户的观看历史数据,滤掉噪声数据;
B、数据挖掘与特征分类模块通过对存储有用户观看历史和电视节目信息的内容数据库进行数据挖掘与数据特征分类,找出用户的观看信息,并将特征分类后的用户观看信息形成一个聚类集;
C、分析模块通过分析用户观看历史内容特征和从上一步获取到的聚类集,从中选择分类,获取代表原始用户行为内容历史的观看历史数据集;
D、模式挖掘模块从所述观看历史数据集中发掘出主要的用户观看模式集,并输出。
所述的挖掘电视观看模式的数据处理方法,其中,所述步骤D具体包括:
D1、将所述观看历史数据集进行如下定义:
指定N为用户特定的时间段的长度,{Vi}(i=0,1,...,N-1)是第i个时间点观看历史数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210164390.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型安全节能环保蒸炉专用炉头
- 下一篇:一种新型经济炉排