大数据时代的数据分析入门指南.docx

大数据时代的数据分析入门指南.docx

  1. 1、本文档共160页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数代

白居析指南

目录

第1章解决问题,你需要“流程”

第一个重点是“划定范围”

从锁定原因到研究对策开始之前的准备工作

数据分析需要“假设”用框架来查缺补漏

开端决定了结论的质量

开始以后很难再扩大视野思考问题之“外”的问题

「解决问题的故事1」

问题:汽车销量下滑,怎么办?

第一步:明确计划与现实之间的差距

第2章分解数据,找到“问题的关键”

“趋势”视点和“快照”视点“WHAT型假设”

表示大小的“平均值”“好用”背后的陷阱

平均值不能代表总体了解“中位数”

“油炸豆腐”和“天妇罗面渣”,哪个更好吃平均值所掩盖的真相

乌冬面和荞麦面的教训

用“波动”的视点给平均值做补充标准差为什么“用不上”

“变异系数”的魅力视觉也是“感觉”

「解决问题的故事2]

第二步:“分解”数据,锁定问题的关键

第3章采用交叉视点,锁定“原因”

表示二者关系的“相关系数”Excel的小妙招

锁定原因也需要“假设”

相关系数的四大优势

找到相关分析的着眼点奖金被用到哪里了

用Excel加载项进行批量分析利用矩阵排列优先顺序

不要随便编故事

「解决问题的故事3]

第三步:建立WHY型假设,关注影响客户忠诚度的要素

第4章制定对策,要依据“方程式”

10秒钟完成一元回归分析关注相关系数的平方

注意事项及应用事例

看相关系数还是看斜率「解决问题的故事4]

第四步:通过一元回归分析,发现车型B和车型C的不同问题

第5章用数据讲故事

解决问题的故事

把解决问题的过程展现出来

在组织中使用数据的价值与难点你能用数字推翻众人的理解吗

更上一层楼(高级技能简介)

第1章

解决问题,你需要“流程”

实际工作中的大部分数据分析都只是运用分析工具来“摆弄”现有的数据。因此,虽然不知不觉中做出很多图表,但耗费大量的精力和时间,最后也不过是总结出一份报告,只是描述了“本月XX分店取得了优异的销售业绩”“经费的使用额在整体上有所增加”等实际情况。当然,这样很难找到有效的应对措施,或者找到造成这种现象的原因。

为了避免这种情形,我们需要了解“流程”,这是数据分析的前提。掌握了流程,才能避免见到数据就立即动手,却总是在原地打转的情况。分析的各个详细流程还会在后面的

章节介绍,我们先来概观一下数据分析的整体流程(故事)。第一个重点是“划定范围”

首先,我们要了解在实际工作中解决业务问题的整体流程,以及这一过程中涉及“数据分析”的范围。解决问题的流程从明确目的或问题开始,然后再逐步运用数据来把握现状,或者从所有数据中找到问题的关键(“A店铺”“B商品”“20~30岁男性顾客”等)。

从开始运用数据把握现状到找到问题关键为止的过程叫作“数据整理”。这一阶段仅限于整理数据,还没到挖掘数据进行分析的阶段。这一阶段的特点是直接运用“总销售额”等表示整体情况的数据。

不过,所有业务都出现同样问题的情况比较少见,大多数情况是只有其中的某些关键部分才是主要问题。为此,需要逐渐划定数据的范围。

不划定对象数据,在所有数据上做文章的话,由于多个要素掺杂在一起,会很难找到问题的关键(着眼于何处、如何划定范围会在第2章介绍)。只有确定了分解数据的角度,对分解之后的要素进行比较,我们才能发现问题的关键。这样就可以从包含所有要素在内的整体数据中,划出作为分析对象的数据范围。

从锁定原因到研究对策

假设我们已经锁定了问题的关键,例如“问题是支店A的销售”或“问题是服务B的集客效果”等。那么接下来,就应该考虑“什么原因导致了这些问题”。为了找到原因所在,需要进一步缩小对象范围。关注2种以上数据之间的关系,有助于锁定原因。这里才是数据分析的精髓。

从上一阶段“找到问题的关键”开始,“数据整理”的工作逐渐开始变为可以叫作“数据分析”的内容。当然,只是找到原因不能算解决了问题,还要针对原因决定必须采取的措施,而且提出方案,不能只是停留在口头层面。

设定什么样的目标?数值是多少?实施需要哪些资源?只有将这些内容落实为具体的数值,决策者才会批准。方案最终获得实施,才算到达终点(实际上,之后还需要检验和反馈实施的结果)。

如果各个分析过程的内容及结果互不相干,无法形成一个连贯的故事,就没有说服力,我们需要通过整个流程,形成一个贯穿全体的故事(经过)。为此,首先要明确最重要的目的和问题,确保所有过程与操作在理论上最终都与这一目的或问题相关,这样整体的逻辑和流程才不会出现偏差。

此外,就像我在日产的所有工作一样,大多数情况下我们都必须在有限的(多是极其有限的)时间里取得某种形式的成果。如果分析漫无目的,时间转瞬即逝,结果很可能会超过期限。

把握包括分析阶段在内的整个解决问题流程,就能从全

文档评论(0)

人生风雪客 + 关注
实名认证
内容提供者

如果有遇到文件不清或断篇的或者需要转换文件格式的情况请联系我,会在第一时间帮你完成完整的文档。文档如有侵权,请及时告知,本人将尽快予以删除,谢谢啦。

1亿VIP精品文档

相关文档