景观过度量化_ 爆品秘籍?—线上三亚跟团游销量影响因素分析

原题:炸药秘籍? -网上三亚旅游销量影响因素分析

最近,“请大家注意”的综艺节目在卫视上播出,该综艺节目以艺人和外行一起参加巡演为特色,引起了网民热烈讨论,引发了巡演热潮。 如何在多次热潮中把自己的旅行产品卖给爆炸品,旅行社深感关注。 我们以三亚脚跟团旅游的在线旅游产品为例,对销售量的各种可能影响因素进行描述建模,统计消费者的评论内容,利用LDA模型进行主题挖掘,将文本挖掘得到的主题出现概率作为派生参数加到后续回归模型中,最终产品的历史销售量

景观过度量化

背景介绍

沙滩、椰风、海韵、三亚城市拥有60%的森林垄断率,209.1公里的海岸线有19处优质海湾。 近十年来,三亚已经建成了23个特别景区。 例如,三亚湾椰子梦游道、西岛海上游乐世界、“海市支洲岛”度假中心、天地岬风景区等。 三亚目前约有200家旅游饭店,四、五星级饭店约有30家。 2018年,三亚市接待人数为2242.57万人,比2017年增加11.3%。 年旅游总收入514.73亿元。 全市有a级以上旅游胜地14处,其中5A旅游胜地3处,4A旅游胜地5处。 三亚已经形成了完整而迷人的旅游产品体系。 这就是选择三亚这个城市作为研究目标的理由。

景观过度量化

纵观网上旅游市场,OTA市场交易规模平稳增长,网上产品也预计有多样化的发展。 随着网上旅游业总体结构的稳定,旅游细分市场运营发展越来越细微,网上旅游市场份额越来越稳定,突围墙越来越高,窗口逐渐缩小,市场集中度进一步提高。 2018年网上旅游交易额达1.2兆元。

景观过度量化

一个网站发布的报告显示,超过70%的游客在旅游时选择了旅游产品,家庭单位的个人团体数量又增加了105%。 旅游产品依然很受欢迎,网上旅游势头和市场交易额也在扩大。 这样广阔的市场发展前景必然是商家的必胜地。 这么多网上旅行社如何在竞争激烈的市场上把自己的产品卖给爆炸品?

小编以“难以赢得客户”为切入点,基于在线三亚旅游产品销售量的影响因素分析,决定让旅行社获得更多销售量和更高利润,从消费者的意见直接打击旅行社的痛点。

景观过度量化

数据说明

本文使用的数据,从某大型在线旅游网,选择所有受欢迎城市作为出发地,每人取其重量,保留1813个样本,各数据显示了三亚旅游产品的相关信息。 其中有销售量信息的样本610个,有评论信息的样本455个。

景观过度量化

景观过度量化

说明分析

我们在攀升的1813条数据中发现,有销售量信息的旅游产品有610个经验,因此本次研究将变量分为两部分,首先分析了产品销售量是否历史性的影响因素。 对有销量的产品进行销量标准化处理,分析其影响因素。

01

原因变量:在线三亚旅游产品是否有售

该网上所有三亚游产品历史销售仅610个,占33.6%。

景观过度量化

参数的记述是以有没有购物、在产品价格上能否看到程序地图为例。 分析如下:

我们发现没有买东西的游戏产品比起买东西的客人更强。 出售的产品比没有出售的产品总体价格低。

看行程地图的产品获得能力明显强于不看行程地图的产品,行程地图的展示使消费者能够直观地理解整个行程,消费者还能够长时间滞留在该产品页面上,提高购买概率。

景观过度量化

02

原因变量:三亚跟团游产品月平均销售量

我们选择历史上销售的所有产品,将产品评审的最早日期替换为在线日期,进行标准化处理,排除在线时间对销售量的影响,得到了我们感兴趣的因素变量——三亚旅游产品的月平均销售量。 做对数处理,制作如下直方图,整体偏右分布,大部分产品销售量不足10 (人/月)。 销量最大值达到700.87 (人/月),该网游自营的海南三亚5美元5日4夜参加了巡回演出。

景观过度量化

参数的记述以旅行天数、合计观光景点数和产品的好评率为例。 分析如下:

旅游天数从3天到9天的旅游产品最受消费者欢迎,旅游公司在制作产品时应该多做这个范围的产品。 行程中的旅游景点数量以3~9个产品的销售量偏差较多,三亚脚跟团的旅游景点所配置的旅游景点总数集中在3~9个范围内。 旅行社安排旅游景点数量时必须适当,景点数量过多会增加成本。

景观过度量化0

好评率是使用该产品的消费者的定量反馈,反映了大众对产品的看法。 我们从图中可以看出,评价率为96%~99%的产品总销量明显高于其他范围的产品,三亚游的爆炸品也在该评价率范围内。

景观过度量化

有意思的是,满意度达到100%但销售量低的产品,可能是因为这些产品是网站上的新产品,广告宣传能力不够,一些高质量的产品没有被普遍发现。

景观过度量化

评论内容的整体说明

首先,我们取出这个网上所有游戏的产品评论信息,共有455件商品有评论内容。 过去使单词无效,追加语料库,追加分词,评价分数在3分以上的区分,评价其馀音,各选出出现频率top140的词作成了如下的词云图。 在好评中频率最高的词汇有酒店、服务、幽默、热情、旅游胜地等。 在评价中最多的是酒店、购物、自费、呼叫、时间、项目等。

景观过度量化

景观过度量化

用LDA建立评论内容主题模型

预处理这455个产品的所有评论内容,利用LDA模型挖掘产品的特点。 打印前6个主题模型,提取顶层词汇,使LDA主题模型可视化,结果显示,在动态交互式网页中,下图仅显示主题4,从下图右侧可以看出与导向要素几乎有关。

景观过度量化

同样,对于其他主题也同样可视化,根据各主题给出的前10个词汇,下表显示了各主题的前10个词汇及其摘要的类别。 评论主题在一定程度上反映了消费者的关注点和需求。 我们计算每个产品出现各个主题特征的概率,即各产品在各个类别的分数,然后应用于回归模型,观察对销售量的影响是否显着。

景观过度量化

景观过度量化

建立回归模型

01

逻辑回归(是否有历史销售额)

1.1模型的建立与解读

首先,我们对于这个网上的所有三亚旅游产品,以是否有历史性的销售量为变量制作初期逻辑回归模型。 基于BIC方针,利用向后的递归进行变量选择。 可以得到如下的最终回归模型。

景观过度量化

根据推定结果,如果有效性水平为0.05,则以下三点备受关注

1 .该网络自营的产品比该网络不自营的产品更容易被消费者“参加”

2 .网页上显示的旅行地图的产品比没有显示的地图的产品更容易销售。 结合网页上显示的自由活动次数这一要素,发现表示自由活动次数的产品,只要客户的能力比没有信息的产品高,网上旅行产品的“店铺”就很重要。

3 .购物的旅游产品比没有购物的产品难以出售。

1.2模型评估

我们建立混淆矩阵,在此情况下设定的阈值是样品的正负比率(有销售量的产品占总产品的比率)。 根据模糊矩阵,模型的错误率提高到44.60%,TPR (真定位速率)为70.05%,预测1的正确能力较好的FPR (假定位速率)为31.67%,错误地预测1为0的概率较低。 AUC=0.77。

景观过度量化

1.3 .模型运用

景观过度量化0

02

线性回归(月平均销售额)

2.1模型的建立与解读

在本节中,选择月平均销售量作为要因变量,构筑初始线性回归模型,利用AIC方针,进行向后逐渐回归的变量的选择。 计算cook距离,消除强影响点,最终选择对数线性回归模型,得到下表。

由于f检验的p值小于显着性水平(0.05 ),因此整个模型是显着的,至少一个参数会对产品的月销售量产生显着影响。 本案例的r方为0.633,参数可解释变量(旅游产品的月平均销售量)变异的63.3%。

景观过度量化

具体而言,它的解释如下:

(1)产品本身的要素:其他要素不变的情况下,该网络自营的旅游产品的月平均销售量比该网络非自营的平均销售量高80.01%,产品是否安排购物和产品价格仍然是重要的要素。 值得注意的是,游客预定的天数,从3号到9号的产品比3号以内的产品月平均销售量高出36.58%,太短的游客不适合大多数人。

(2)产品评价因素:将其他因素控制在一定水平,评价率将提高1%,月平均销售量将增长2.28%。 我们还将发掘的评论内容的主题作为各产品评论的出现概率进行了模型,发现饮食居住因素、导游因素和课程得分是影响产品销售量的因素。

2.2模型评估

在以下输出的一系列诊断图中,根据残差图,异方差的现象不明显。 根据QQ图,正规性非常令人满意。 右下角的Cook距离图显示样本无强影响点。

景观过度量化

2.3模型的应用

下图的回归系数的可视化显示了产品的好评率在所有影响因素中影响最强,好评率高显示了消费者对该产品的满意度高,这样的产品容易成为“爆炸品”。

景观过度量化

从产品本身因素的影响来看,我们的模型显示平均月销售量与负相关关系,分别为购物(基准组:无购物)、价格、自由活动次数。

评论内容发掘的主题是关于月平均销售量的说明: 6个主题中的5个主题是关于销售量的说明很显着。 其中,导游要素得分和课程得分对平均月销售量的影响较大,表明消费者购买完该产品后,对导游和整体安排印象最深。 除此之外,饮食因素的得分对销售量有很大影响,饮食因素的得分取决于旅行社在设计旅游产品时是否妥当。

但是,同步的数据被建模,结果只能用于解释。 但是,对于平台方面来说,可以收集更多的产品信息,可以使用与销售前期对应的评论数等其他信息进行模型化,还可以用于销售预测等工作。

景观过度量化

总结和建议

以下根据全文分析结果向旅行社提出建议

景观过度量化

景观过度量化

景观过度量化

大家都在看

相关专题