迄今为止,《哪吒之魔童降世》已上映54天,这部连续打破上映期间单日票房、单日综合票房破亿天数等多项记录的电影,已成为国产动画电影的新兴代表。
早在影片上映后一周,猫眼专业版就发布预测《哪吒》总票房能到41亿。此预测结果一出,众多网友直呼"疯了",而从现实情况来看,基本与预测方向一致。猫眼8月7日预测《哪吒》总票房达到46.8亿,超过《流浪地球》,最终也都实现了。
猫眼是如何做到如此精准的票房数据预测?近日,猫眼数据专家揭秘了票房精准预测背后的"基石"何在。
常量+变量 打造精准无误的数据
国外有一些票房预测系统显示,票房预测的原始数据来自于研究人员、投融资社区、市场分析。根据这些数据,系统会判断什么样的电影更容易得到票房青睐。
但这些数据会随着类型、评分、档期、票房体量、近期走势的变化而受到影响,最终结果也会差强人意。
当互联网技术介入后,电影票房预测也迎来优化。以《哪吒》为例,猫眼在上映约一周之后发布了超过40亿的预测结果,在前期参考其类型、评分因素,以《大圣归来》为参考影片;后期《哪吒》的票房走势出来后,发现他与《战狼2》的走势相像,参考《战狼2》的走势调整接下来的票房预测;在《哪吒》上映期间,根据多部上映影片的表现情况实时调整其预测票房,从而使得总票房预测能够在较早的时间调整至合理结果。
简单而言,算法的基本逻辑,是根据相似电影的票房规律预测新电影的票房。相似电影的选取会有若干条件(如类型、评分、所处档期、票房体量、近期走势等),然后基于这些相似电影,构建预测天级票房或总票房的机器学习模型。而机器学习模型用到的特征工程,背后也有一套比较复杂的方法。
经过多年的积累,猫眼有一套比较完整的票房预测工具,包括天级票房预测(未来3天每日大盘票房预测)和单影片总票房预测等算法。例如在天级票房预测上,因为猫眼有着准确的实时票房(及未来预售)数据作为支撑,每日预售票房的涨跌幅都会对次日或者近几日的票房预测提供重要依据。因此,猫眼可以利用大数据优势,选取历史相似样本并构建机器学习模型,可以非常准确地预测未来某日的票房。
由于猫眼庞大的实时票房详细数据、电影天级票房和总票房样本、以及猫眼平台的交易数据等优势,这些算法可以达到更为精准的预测效果,实时票房准确度可以达到99%以上,次日天级票房预测准确度可以达到90%左右。
但周五的天级票房预测是个考验,因为大部分影片会选择在周五上映,新片的影响具有很大的不确定性。目前猫眼的算法是实时训练和预测的,可针对一个新的待预测电影,实时选取相似电影,并训练模型以及预测。这套算法的精度随着样本的积累或越来越好,当新样本积累到一定程度,猫眼会对模型重新优化。
进化迭代的学习能力 造就对中国电影市场的影响力
此前,猫眼成功预测《速度与激情8》,当年在映前1日,对外发布了首日票房和总票房的预测,首日票房和总票房误差都在5%以内,获得了非常理想的结果。
众所周知,在电影上映前就已准确预测出首日票房和总票房数据难度非常大,在猫眼发布《哪吒》预测结果候很多人都说猫眼疯了,但等到电影票房持续走高,众多网友直呼"神了",同时也验证了猫眼在票房预测方面担任了"预言家"般的角色。
随着机器学习能力、样本数据和经验的积累,猫眼预测的准确性将越来越高。制片方、发行公司和院线,都可以根据已知的票房影响的数据统计和分析,得到正确的决策倾向,让影片更受市场欢迎,实现效率最大化。
猫眼票房预测模型不仅对票房预测或市场评估产生重要意义,在中国电影的发展与动态方面,也将提供新的研究方向,成为适应中国市场的模型量表。