[发明专利]一种电影票房的映前预测方法在审
申请号: | 202110591509.8 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113379448A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 孙利军 | 申请(专利权)人: | 西安影视数据评估中心有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/242;G06F16/2458;G06F16/953 |
代理公司: | 苏州中合知识产权代理事务所(普通合伙) 32266 | 代理人: | 阮梅 |
地址: | 710000 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电影票房 预测 方法 | ||
本发明公开一种电影票房的映前预测方法,包括如下步骤:获取目标电影相关的基本结构化信息和社交平台舆情数据;对电影的基本结构化信息进行预处理,生成电影的结构化训练数据;利用自然语言处理技术对社交平台舆情数据进行处理,获得电影的舆情语料训练数据;利用社交网络分析技术对基本结构化信息中的演职员列表进行处理建立社交网络,并基于社交网络确定电影中各演职员的社交网络重要度;基于电影的结构化训练数据、舆情语料训练数据和各演职员的社交网络重要度数据,利用GBM算法构建回归预测模型;利用回归预测模型对目标电影进行预测,获得目标电影的总票房数据。本发明达到提高电影的总票房预测准确度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种电影票房的映前预测方法。
背景技术
电影作为一种特殊的商业产品,出品方在其上映之前就展开了密集的宣传工作,在其上映后同样需要根据具体情况进行口碑营销,院线也会根据电影的市场表现调整排片计划,因此,在上映前对电影的票房进行精准预测具有较强的现实意义。由于电影项目涉及制作团队的商业和艺术水平、大众心理、趋势热点等因素,是一项复杂的系统工程,一直以来缺乏在上映前对电影票房预测的有效方法。
目前业内的普遍做法的是基于首映票房或首周票房对上映后的电影总票房数据进行预测,由于首映票房或首周票房占总票房的比例较高,且上映后的电影日票房波动趋势具有相似的趋势性和周期性,预测难度较映前预测大为下降。但是考虑到对上映中电影总票房预测具有一定滞后性,因此此类预测结果无法及时指导营销和排片计划的调整方向。
著名机器学习竞赛平台Kaggle在2019年举行了电影票房预测挑战赛,训练与测试数据来自TMDB电影数据库,最终1395支队伍提交了有效模型与测试结果。从赛后各队伍公开的建模流程来看,大部分参赛队伍都使用了基于xgboost、gbm以及随机森林等算法的集成模型,而电影制作的预算成本则是最重要的特征因素。虽然竞赛中涌现了很多技术亮点,拓展了数据科学家针对票房预测这一课题的思路,但是在电影行业特别是在中国大陆,精确的预算成本一手数据是难以获取的,而由于预算成本特征对模型性能至关重要,反而限制了相关技术的落地应用。
对于电影票房的映前预测,一种主流做法是基于目标电影的同类型其他电影的市场表现、同期电影市场热度、点映口碑、预售热度等因素,由行业专家凭借经验给出大致的票房区间,这种做法更依赖于专家的个人经验和主观判断。
发明内容
为了解决上述技术问题,本发明提出一种电影票房的映前预测方法。
为了达到上述目的,本发明的技术方案如下:
一种电影票房的映前预测方法,包括如下步骤:
获取目标电影相关的基本结构化信息和社交平台舆情数据;
对电影的基本结构化信息进行预处理,生成电影的结构化训练数据;
利用自然语言处理技术对社交平台舆情数据进行处理,获得电影的舆情语料训练数据;
利用社交网络分析技术对基本结构化信息中的演职员列表进行处理建立社交网络,并基于社交网络确定电影中各演职员的社交网络重要度;
基于电影的结构化训练数据、舆情语料训练数据和各演职员的社交网络重要度数据,利用GBM算法构建回归预测模型;
利用回归预测模型对目标电影进行预测,获得目标电影的总票房数据。
优选地,还包括如下步骤:通过网络爬虫和人工标注的方式获取目标电影相关的基本结构化信息和社交平台舆情数据。
优选地,所述基本结构化信息包括类型、制片国家、语言、时长、上映日期、演职员列表、制片公司列表、IMDB号、影片官方网站、影片预告片列表和电影的票房数据等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安影视数据评估中心有限公司,未经西安影视数据评估中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110591509.8/2.html,转载请声明来源钻瓜专利网。