数据分析思维

以下是一组某电商应用消费数据,你能从中看出什么?

日期 2019/06/01 2019/06/02 2019/06/03 2019/06/04 2019/06/05 2019/06/06 2019/06/07
金额(万) 213 181 163 147 152 155 171

我们应该能很容易的注意到:

  1. 6月1日消费比较多
  2. 6月2日消费也很多,但相对降低
  3. 6月3号到6号消费量持平
  4. 6月7号又开始上涨

但是这些意味着什么呢?如果是一个数据分析师,他应该能结合数据的周期性规律进行解读:

  • 6月1日儿童节,大家的购物需求可能会上涨,此时可能会有礼品购买、活动举办等情况发生。同时6月1日恰逢周六,节日与周末叠加,消费需求应该更旺盛。
  • 6月2日周日,消费大幅降低,但依然保持着较高水平。
  • 工作日周一和周五,分别对应工作日开始和结束,人们有着较高的消费需求。结合我们平日的工作,周一有可能企业会有集中的办公品采购,周五则可能提前进入周末假期。

总结起来,电商消费数据可能存在下述周期性规律:

  1. 周末消费量高
  2. 节日消费量高
  3. 工作日周二、周三、周四消费量低
  4. 工作日周一、周五消费量高

为更好的显示这样的周期性规律,可以绘制消费金额随时间的变化曲线:

transaction_total_of_time.png

为突出变化趋势,将每一天的消费金额减去平均值,再次绘制曲线如下:

averaged_transaction_total_of_time.png

这些观察对企业而言意味着什么呢?分为现状和未来两个方面来看。对于当前现状,可以分析当前业务是否健康。对于未来,可以预测后续消费数据,为仓库备货提供参考。

为分析业务健康状况,还需要历史数据做支撑。此时可以考虑搜集历史的消费数据进行分析。搜集前两周的数据,并以周为周期计算预测值如下:

predicted_transaction_total_of_time.png

其中:

  • 6月1日预测数据由5月18日和5月25日数据的平均值得到,6月2日预测数据由5月19日和5月26日数据的平均值得到。以此类推。
  • 节日效应为:6月1日的数据与预测数据之差,即 213 - 187.5 = 25.5
  • 6月8日的数据由5月18日、5月25日、6月1日的数据减去节日效应,并取平均得到,即(185 + 190 + 213 - 25.5) / 3 = 187.5

有了这些分析,可以发现:

  1. 除了节日效应之外,6月1日到7日这一周的数据与预测值相差不大,可以认为业务活动趋于稳定
  2. 下周需备足金额为1153万的货

如果还想进一步确定哪种货物备多少,那就继续分析每一种货物的出售情况。

上述分析结论可以有力的支持企业进行决策,这就是数据分析的力量。

数据分析的过程看上去好像很厉害的样子。但是仔细一想,这些分析的过程中也没用到什么高端的技术啊?作为程序员,这些我也会。事实上,这里主要是数据分析思维在发挥作用。

那么什么是数据分析思维,在我看来,就是有经验的数据分析师们惯用的思维模式。下面来看看都有哪些思维模式。

数据分析思维

数据分析思维一:建立标准的数据分析流程

回顾上述的数据分析过程,可以发现数据分析一般可以分为这样六个步骤:

  1. 定义分析目标:评估当前的业务状况,为库存管理提供支持
  2. 确定分析思路,提出假设:按时间维度进行分析,周末节假日消费高,工作日一五消费高,工作日二三四消费低
  3. 搜集数据:搜集前几周的数据
  4. 数据预处理:对数据进行初步的分析处理,处理空值、异常值等
  5. 分析数据,验证假设:分析数据变化规律,验证之前假设是否正确
  6. 给出结论及建议:当前业务表现正常,下周备货1153万

在开始真正分析数据之前,先定义分析目标、确定分析思路并提出合理假设,这两个前置步骤对于数据分析非常关键。它们决定了要如何进行后续分析。没有思路,无法进行分析。思路不对,则后续分析都是无用功。

除此之外,做出分析结论通常也是一件极具挑战的任务。如果分析结论不能论据充分并结合客观业务现状,那么来自业务方的挑战将使你失去信任。比如,在上面的例子中,如果我们发现6月1日销售额上涨,没有进行深入分析,就直接归因于市场部的营销活动做得好。这个时候,市场部的人跳出来说,我们没有做什么活动呀。那是不是很尴尬?

数据分析思维二:业务指导分析过程

先来思考一下,对于这样几个问题,你可以给出答案吗?

  • 张妈妈的孩子半岁大,喝婴儿奶粉,请问多少天后张妈妈需要买下一罐?
  • 李妈妈家想换房,一家又老又破旧的小房子却比一个优质的高层小区房单价贵一倍,为什么?
  • 王女士信用卡额度20000,一个月刷了10000。她老公额度15000刷了7500。王女士和她老公谁对于银行更有营销潜力?

这里的答案分别是:

  • 6
  • 学区房与郊区房
  • 差不多

如果我们没能答对这些问题,这说明我们不懂这部分业务。但是,这些业务知识对于一个数据分析师而言却非常重要。

比如,对于一个卖奶粉的电商业务,我们想统计流失的客户,以便进行客户挽回。应该如何计算客户是否流失呢?有了上面的业务知识,就可以很简单的知道,如果某个客户一周以上都没有再来买奶粉了,那他多半就是流失了。

比如,对于某一个房产中介,如果要进行线上广告投放,该如何定位目标群体呢?有了上面的业务知识,就可以知道,对于学区房,应该主要投放给有孩的较高收入家庭。对于郊区房,更多是投放给收入不高的青年家庭。

数据分析的一大误区就是过于专注数据,而忽视业务的指导。

事实上,丰富的业务知识是数据分析得以有效开展的前提。具备了相应的业务知识,就能具备对于数据的敏感度,不仅可以引导分析思路,还能避免一些明显的业务问题。

数据分析思维三:指标思维

比如“最近业绩上涨了”这只是说明业绩的一个变化,我们无法知道上涨的时间段或程度。指标思维就是“这个月业绩上涨10%”。这里对应的指标就是“月业绩上涨率”。

数据分析要避免用模糊的文字描述来衡量变化,而改用清楚的数字。

有些场景直接量化难以操作,此时就需要将其拆解为几个容易量化的指标。比如,衡量用户对产品的喜爱程度,可以改为衡量用户单次使用应用的平均时长、用户使用频次、分享次数等综合指标。

数据分析思维四:分析模型思维

成熟的业界研究多年的分析模型是数据分析师常用的工具包。

如需要分析行业发展前景时,行业竞争情况时,考虑使用SWOT、PEST、五力模型来进行分析。需要分析企业经营情况时,采用杜邦分析、评分积分卡模型等。需要分析市场营销、渠道运营可以考虑采用4P模型、4C模型、5W1H模型。分析用户时,可以考虑转换漏斗等。

这些分析模型可以帮助我们建立思维框架。

数据分析思维五:将复杂问题分解为小问题

数据分析师的一个关键思维方式就是将复杂问题拆解为小问题。

常用的分析模型可以帮助我们进行问题分解。但是不是任何地方都适用,很多时候我们需要结合场景进行问题拆解。

一般的做法就是采用思维导图来辅助进行拆解。比如,如果我们要分析如何短期扩大公司利润,从产品角度来看,可以进一步拆解为:现有产品与新产品,现有产品可以进一步拆解为主力产品和搭配产品,对于主力产品可能可以进一步扩大销售渠道。对于搭配产品,可以考虑停止生产,降低成本。对于新产品,可以考虑分解为设计阶段、研发阶段、试验阶段等。

task-split.png

注意这里的分解尽量做到MECE,为此可以采用分箱拆解法。比如用户消费能力可以按照消费额分解为五个等级。然后再对每个等级的用户采取不同的措施。

数据分析思维六:提出多种方案,并进行对比

解决问题的办法通常不止一种,如果我们找到一种方案便停止分析,在专业的业务人员看来,结论一般会过于草率,不够专业。

还是以如何扩大公司利润为例。可以有多种途径可以实现,从利润 = 收入 - 支出的公式来看,可以提高收入,也可以降低支出。而提高收入的方式又有多种,可以上调产品价格,扩大销售渠道,引入新产品等等。支出也可以进一步分为产品生产成本、市场推广成本、销售成本、运营成本、新品研发成本等等。具体采取哪种方式,需要结合公司战略、市场行情等因素综合确定。

数据分析思维七:对数据质量保持怀疑

数据分析师需要对数据质量保持怀疑的态度。因为数据搜集是一件很困难的事情,好的数据不一定有,数据有了不一定对。

因为涉及隐私问题,用户一般是不愿意提供数据的。我如何知道你会不会拿去卖给其他人?我也不想每天接到无数个贷款、中介的骚扰电话了。就算银行存款业务,在开户的时候也只能确保拿到正确的身份证,也就是只有性别和年龄,开通手机银行才能登记到准确的手机号。

其次,搜集高质量的数据是更很难的。比如,调查表可能是执行人员随便找人填的。又比如,申请房贷的时候,填的工资证明可能是房屋销售人员为了获取一定的银行回扣,故意让你填的一个数。

数据质量在企业中是一个永恒的话题,企业里面永远在想办法提升数据质量。常常能看到线下店购物注册会员有优惠或积分,这其实是商家让利以便获取用户的信息。信用卡提额可以通过提供资产证明来实现,银行通过给高额度来搜集客户资产信息。

既然获取高质量的数据这么困难,我们在分析数据时,就不能轻易相信数据的正确性。需要反复推敲信息来源并提出可能的问题,使用数据清洗,异常值处理等手段来降低数据噪音。

数据分析思维八:在全面深入分析之前,不过早下结论

数据分析是一个深入思考并进行数据验证的过程,不过早下结论是数据分析师需要具备的素质。

如果没有深入分析,我们可能会一看到应用日活上涨,就觉得是应用质量有提升。一提到引入新用户就是做广告。这么直接浅显的结论无法让人信服。

对于日活上涨,从用户结构的角度分析,我们可以看这些上涨来自哪一部分用户的贡献。来自新用户,还是老用户呢?是新用户增加了?还是老用户使用频率提高了?从营销的角度分析,我们可以看这些用户是来自哪个渠道的,进而分析这个渠道最近是不是有促销等等。

对于引入新用户,方法也很多。比如可以考虑不同业务线进行交叉销售,让销售人员进行电话营销,投资进行热点软文营销等等。

通常,对于一个结论的合理性,我们要尽可能的多方面去寻找数据支撑。只有进行过周密分析之后得出的结论才是有说服力的。

总结

前面讨论的数据分析思维多而杂,但是如果我们将其纳入一般的数据分析流程中,可以得到下图:

mind-set.png