[发明专利]一种数字电视用户行为的大数据采集与分析方法及系统在审
申请号: | 201510318019.5 | 申请日: | 2015-06-11 |
公开(公告)号: | CN104936023A | 公开(公告)日: | 2015-09-23 |
发明(设计)人: | 俞冶 | 申请(专利权)人: | 嘉兴市广播电视集团 |
主分类号: | H04N21/442 | 分类号: | H04N21/442;H04N21/466;H04N21/258 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 于忠洲 |
地址: | 314001 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字电视 用户 行为 数据 采集 分析 方法 系统 | ||
技术领域
本发明涉及一种数据采集与分析方法及系统,尤其是一种针对数字电视用户行为的数据采集与分析方法及系统。
背景技术
近年来,随着“大数据”概念的普及,在许多领域,服务提供商开始有意识地对海量用户数据的进行实时采集与分析,从而提取有价值的潜在信息。例如,在在线购物领域,阿里巴巴旗下的淘宝对每个用户的网上购物习惯(例如商品购买历史、商铺浏览记录等)以及其个人信息进行综合分析,从而实现个性化的商铺推荐,提高用户购买效率与商铺销售额。在网络视频领域,YouTube以及优酷依据用户信息(例如地理位置、性别等)以及用户的浏览历史,为用户推送相关的广告以及其他同类视频;在零售领域,梅西百货(Macy’s)通过对不同商品需求和库存的情况的实时统计与分析,进行商品的实时调价,从而实现利润最大化;在信用卡领域,美国运通公司(American Express)通过对用户信用卡历史交易数据的建模与分析,来预测客户忠诚度,并采取相应促销手段提升忠诚度。
但是,在大数据应用快速发展的同时,广播电视领域的用户收视行为数据采集与分析,却仍然停留在主要依靠人力的阶段。具体来说,这种传统的信息采集与分析方法按照以下流程进行:1)广电服务商委托调查公司进行用户收视调查;2)调查公司对用户随机抽样;3)调查员人工上门递送纸质调查单;4)用户手动填写调查单;5)调查员上门回收调查单;6)调查公司手工整理与分析数据;7)调查公司将分析结果反馈给广电服务商,为广告投放与电视节目制作提供参考。然而,该方法存在很多缺点。首先,它需要耗费大量的人力物力;其次,它涉及到除广电与用户外的第三方机构(调查公司),使得流程更复杂、保密性更差;最后,此方法所采集到的数据以及在此基础上的分析,往往准确性较差、实时性较低、覆盖面较窄。
当今,三网融合的进一步推进,尤其是数字电视的双向改造,为“广电大数据”提供了契机。在此背景下,如何实现对海量广电用户收视行为数据的自动采集与高效分析,已成为广播电视技术的一项重要研究课题。
发明内容
本发明要解决的技术问题是传统的信息采集与分析方法费时费力、流程复杂、保密性差、准确性较差、实时性较低且覆盖面较窄。
为了解决上述技术问题,本发明提供了一种数字电视用户行为的大数据采集与分析方法,包括如下步骤:
步骤1,将数字电视用户对数字机顶盒进行交互操作的操作数据进行实时记录,并将操作数据存储至本地存储器中;
步骤2,读取本地存储器中的操作数据,并对操作数据进行预处理,获得每个节目的观看时长、数字电视用户的调台次数以及每个节目的平均观看时长;
步骤3,将预处理获得的观看时长、调台次数以及平均观看时长作为预处理数据定时或定量地远程发送至远程存储器中;
步骤4,读取远程存储器中的预处理数据,并按照分类规则对预处理数据进行分类处理,再将分类处理获得的分类数据分类存储至面向大数据的数据库中;
步骤5,按照分类有序读取数据库中的分类数据,并对各个类别的分类数据进行分析,获得数字电视用户的收视习惯和/或电视节目的收视率。
采用自动实时记录操作数据替换现有的人工采集,能够有效提高了数据采集的效率和全面性,简化了采集复杂的人工采集流程,同时也避免了用户信息泄露;采用预处理步骤能够有效减少操作数据的传输量,降低了传输功耗;将分类数据分类存储至数据库中,能够方便数据分析时分类读取各个分类数据,提高了分析效率;采用主动采集分析获得收视习惯和/或收视率,能够有效提高数据采集的准确性,避免人工采集时数字电视用户任意填写表格。
作为本发明方法的进一步限定方案,操作数据包括节目名称、调台时间点以及节目慢放控制。
作为本发明方法的进一步限定方案,分类规则包括收看时间段、节目类型、收视人群、收视地域以及收视率范围。
作为本发明方法的进一步改进方案,还包括如下步骤:
步骤6,利用预测算法根据收视习惯和/或收视率对数字电视用户的收视行为进行预测,获得数字电视用户期望收看的电视节目的收视预测报告。采用预测算法获得收视预测报告,能够方便广播电视运营商向数字电视用户针对性地推送所期望的电视节目,既能够有效提高数字电视用户收看电视节目的兴趣,又能够有效提高广播电视的收视率。
作为本发明方法的进一步限定方案,预测算法为聚类算法、回归算法、神经网络或深度学习算法。
作为本发明方法的进一步改进方案,还包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉兴市广播电视集团,未经嘉兴市广播电视集团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510318019.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置