[发明专利]一种电视剧单日收视率的预测方法在审
申请号: | 202110590869.6 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113379447A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 孙利军 | 申请(专利权)人: | 西安影视数据评估中心有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/242;G06F16/2458;G06F16/953 |
代理公司: | 苏州中合知识产权代理事务所(普通合伙) 32266 | 代理人: | 阮梅 |
地址: | 710000 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电视剧 单日 收视率 预测 方法 | ||
本发明公开一种电视剧单日收视率的预测方法,包括如下步骤:获取目标电视剧相关的基本结构化信息和社交平台舆情数据;对电视剧的基本结构化信息进行预处理,生成电视剧的结构化训练数据;利用自然语言处理技术对社交平台舆情数据进行处理,获得电视剧的舆情语料训练数据;利用社交网络分析技术对基本结构化信息中的演职员列表建立社交网络,并基于社交网络确定电视剧中各演职员的社交网络重要度;基于电视剧的结构化训练数据、舆情语料训练数据和各演职员的社交网络重要度数据,利用GBM算法构建回归预测模型;利用回归预测模型对目标电视剧进行预测,获得目标电视剧的单日收视率。本发明可以提高电视剧的单日收视率预测准确度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种电视剧单日收视率的预测方法。
背景技术
电视剧作为一种特殊的商业产品,出品方在其上映之前就展开了密集的宣传工作,在其上映后同样需要根据具体情况进行口碑营销,各类播放平台如电视台、视频网站等也希望在电视剧开播前预测其收视水平,以实现价值评估的目的,因此,对于电视剧的收视率进行精准预测具有较强的现实意义。由于电视剧项目涉及制作团队的商业和艺术水平、大众心理、趋势热点等因素,是一项复杂的系统工程,一直以来缺乏对电视剧收视率预测的有效方法。
目前业内的普遍做法的是基于目标电视剧的同类型其他电视剧或主创团队其他作品的市场表现、同期电视剧市场热度、观众期待市场调查等因素,由行业专家凭借经验给出大致的收视率区间,这种做法考虑因素较少,且更依赖于专家的个人经验和主观判断,导致判断结果不够精确,无法更好的进行电视剧的舆情预测或营销推广等应用。
发明内容
为了解决上述技术问题,本发明提出一种电视剧单日收视率的预测方法。
为了达到上述目的,本发明的技术方案如下:
一种电视剧单日收视率的预测方法,包括如下步骤:
获取目标电视剧相关的基本结构化信息和社交平台舆情数据;
对电视剧的基本结构化信息进行预处理,生成电视剧的结构化训练数据;利用自然语言处理技术对社交平台舆情数据进行处理,获得电视剧的舆情语料训练数据;
利用社交网络分析技术对基本结构化信息中的演职员列表进行处理建立社交网络,并基于社交网络确定电视剧中各演职员的社交网络重要度;
基于电视剧的结构化训练数据、舆情语料训练数据和各演职员的社交网络重要度数据,利用GBM算法构建回归预测模型;
利用回归预测模型对目标电视剧进行预测,获得目标电视剧的单日收视率。
优选地,还包括如下步骤:通过网络爬虫和人工标注的方式获取目标电视剧相关的基本结构化信息和社交平台舆情数据。
优选地,所述基本结构化信息包括播放日期、集数、单集时长、制片国家、类型、语言、制片公司列表、演职员列表、IMDB号、官方网站、预告片列表和电视剧在特定平台的单日收视率等。
优选地,所述预处理为对基本结构化信息中的数值型特征进行标准化处理,对因子型特征进行规范化并生成哑变量矩阵。
优选地,所述利用自然语言处理技术对社交平台舆情数据进行处理,获得电视剧的舆情语料训练数据,具体包括如下步骤:
对获取的社交平台舆情数据进行初步清洗;
对初步清洗后数据信息进行新词发现以及确定;
利用分词工具对确定的新词进行分词处理并去除无意义项,获得分词结果;
在所得分词结果中统计电视剧中演职员提及数、好评差评比、单日最大舆情数、平均舆情数、舆情数标准差、发布舆情去重用户数等数据,作为舆情语料训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安影视数据评估中心有限公司,未经西安影视数据评估中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110590869.6/2.html,转载请声明来源钻瓜专利网。