数据分析师需要学什么_扭曲数据的9大手段,数据分析师速看

文章

总结了9种最常见的扭曲数据的方法,我们应该首先记住这一点。很有可能你会在年终总结、年度计划、活动评估和其他场合遇到他们。提前知道比提前处理好。

数据分析师需要学什么

做数据分析,只有数据可以分析

如果数据不真实怎么办?

如果数据被人为扭曲了呢?

如果数据被人为扭曲,您还需要接受它吗?

让我们今天讨论这个话题在春节结束之前,让我们一劳永逸地消除这些不良想法。让我们收拾心情,告别旧的,迎接新的。

第1部分:虚假数据

数据分析师需要学什么

业务方故意虚报、谎报或不报数据,导致基础数据缺失,错误频发这种情况在使用纸张的时代非常普遍。然而,随着数据系统的普及,这个问题变得越来越不常见。

如果仍然有使用纸张的场景,例如用户纸张申请表和问卷,这个问题仍然存在。解决方案也很简单:去微信卡套餐!注册会员什么时候还会写纸质表格?第

节第2位:人工修改

数据分析师需要学什么

参见:

数据分析师需要学什么

系统是死的,但人类是活的如果你想解决这个问题,你只能加强考试。违反规定的人是该死的。这些操作具有很强的规律性,并且与特定人员的行为高度相关,这可以通过分析来识别。第

节第3位:修改后的口径

数据分析师需要学什么

数据不好看,该怎么办?直接改变统计口径!本质上,数据指示器是为了方便计算而设计的,用户可以随意更改。然而,由于口径的变化,不一致的数据是一个大问题。仅改变统计口径而不改变索引名称是一个大问题。因此,可以改变口径,并且只有在根据新的口径报告过去的数据之后,才能一次性完成。

段4:控制节奏

数据分析师需要学什么

参考:

数据分析师需要学什么

注与段2不同,段2是欺骗公司的虚假数据,性质恶劣《段威4》本质上并没有伪造数据,而是利用销售、运营和奖励规则来最大化个人利益。

实际上是个人会这样做,这属于商业的潜规则我们常说“水清则无鱼”。你不能要求一个人不为自己着想。如果你真的管理得太多,第一线的企业肯定会换工作然后逃跑。

作为数据分析,更需要能够识别这些具体问题并将它们控制在可接受的范围内。如果问题太普遍,那么看看如何在系统层面上促进优化和调整(如下图所示)

数据分析师需要学什么

请注意,从这个问题开始,我们将进入中级难度,因为以下问题将要求单个数据分析师越来越高的分析能力。例如,它需要一些分析和经验来区分哪些是合理的隐藏规则,哪些是恶意更改。在做数据分析时,你必须经常听到这样的问题:“最近活动率下降了吗?“近期销售业绩不理想的原因分析?分析原因“为什么我们的产品这么差?“

但是,你花了很大力气去挖掘大量的数据,结果发现:没有什么问题吗?恭喜你,你有一整套随机节奏。商务谈判中的“衰落”、“糟糕”和“不满意”可能是错误的主张!

数据分析师需要学什么

请注意,业务方无意中扭曲了数据判断,许多新的数据分析师将直接介入。许多新人做分析,不是问它是否是第一个,而是直接研究为什么根据用户群、注册时间、产品类型等,这些数据被撕成碎片,无法解释。过几天我回来时,我可以看到问题已经不存在了。

数据分析师需要学什么

应该回答这种问题,记住“大小、数量、高度、速度、好坏”是第一个要问的标准。当你听到一个特定的问题时,首先要问你是如何知道这个问题的。当你听到人们谈论数据时,首先要问原始数据源。然而,困难在于三个“第一个问题”违背了人类的本能。听风雨是人们最习惯的思维方式,所以这三个看似简单的问题需要大量反复和强化的训练才能学会,否则往往会被忽略。

第6级:满意度

数据分析师需要学什么

此处的满意度是指业务部门高度评价但难以直接用系统记录数据的指标类似的项目包括满意度、品牌影响力、产品影响力、行业地位、新产品等等因为缺少直接记录,会造成什么样的蛾。在最后一篇文章“拯救猪的队友”中,陈先生详细介绍了如何处理这类问题,下面将对此进行回顾。第7节

:自然增长率

数据分析师需要学什么

最后想操纵数据,只要“自然增长率”数据是不断变化的,你能不能换成负数(如下图所示)

数据分析师需要学什么

对付这个方法最好的办法就是忽略他参加活动的实际人数很容易计算清楚。如果要确定自然增长率,可以事先商定,以免事后罗嗦。

段第8位:参考组

数据分析师需要学什么

参考组和自然增长率是一对他是我的兄弟人们很容易为“科学评价”建牌坊。事实上,牌坊是随意改变的,并且将会改变,直到业务令人满意。如果业务方想挣扎,他总是说你建立的参考小组不科学,样本都是特例,不够随机,没有代表性。与

相比,我们会发现不同的部门使用不同的方法。销售、促销、供应链这些一线部门,数据本身就是他们工作的直接产物,所以最容易篡改数据源运营、规划、产品等部门喜欢制定难以量化的指标,喜欢谈论“深远影响”,喜欢建立一堆“自然增长率”和“参考群体用户”,然后消除它们,篡改基于数据的判断为什么

不关心销售、促销和供应链?因为人们面临着扎实的销售收款、促销进人和仓库出货的问题,一个人的头脑很清楚,一分钱一分货,没有扯皮但是当我们一起做一些像运营、计划和产品这样的事情时,我们总是想突出我们的贡献。然后开始无休止的拉扯"除去自然增长,我的活动带来了多少好处?""除去自然增长、活动拉动,我的产品改版带来了多少好处?"“除去自然增长、活动拉动、产品修正,我的拷贝带来了多少好处”...

如果我们必须比较这两种危害,那一定是篡改数据源更有害。"如果数据是假的,那么分析是不可能的。篡改数据源代表了公司混乱的管理和薄弱的渠道控制。有趣的是,总部的所有职能部门都讨厌这种弱点,所以在这个问题上,总部各部门经常拿枪指着外面的世界。

,但在数据判断中,通常是从头开始。总部的运营、产品和规划者为了自身利益任意改变标准,这对实现真正的数据驱动非常有害。不敢面对事实,用数据粉饰形势。最终的结果是,业务部门本身越来越失去判断能力。它又回到了拍着脑袋做决定的原始状态。我们不想看到这个。

的理想状态是真实丰富的数据来源,简单清晰的数据判断,深入立体的数据分析更加注重寻找原因,做出预测和测试结果,以便输出更好的结果。

#专栏作家#

这篇文章最初是由每个产品经理发表的。未经许可,根据CC0协议

, Unsplash禁止重印

张图片

大家都在看

相关专题