在我求学的生涯里,不知道是受了应试教育的苦,还是自己资质平庸,对于数学只停留在考试阶段,从未真正感受过数学之美,或是享受过数学的乐趣。对于数学,内心有几分莫名的惧怕。选择一本数学类的工具书来阅读,必须有勇气。
为什么突然有兴趣阅读这本《数据思维》呢?有两个小契机。前几日和一位自动化专业的博士面基,聊起她的专业,眉宇之间皆是热爱。作为一个工科小白,虽然我听的云里雾里,但因此对机器学习和人工智能产生了兴趣。碰巧近来多次听查理芒格的多元思维模型,数学作为一项基础学科,成功吸引了我的注意。
这是一个最好的时代,大数据知道你的一切,打开网易云音乐它知道什么是你的“心头好”,购物网站几乎能准确预判你的消费,导航软件帮你避开拥堵路段.....这是一个最坏的年代,这个时代你没有隐私,互联网的每一个节点都留下了你的电子足迹。
没错,这都是数据干的。数据思维的模型到底是什么样的?作为一个普通人或是一个创业者,拥有数据思维,能给我的生活或是企业带来哪些改善?带着问题去书里寻找答案。
这本书的作者颇有名气,他是北京大学光华管理学院的EMBA教授王汉中,做统计学研究十几年,也常常跟企业高管打交道。微信公众号“狗熊会”创始人,这本书里的许多文章在公号里都有收录。
书分两部分,第一部分适合对数据应用感兴趣的人,便于了解数据的概念和价值,以及人人都应该建立的数学思维;第二部分是技术流,适合搞数据分析的同学研读,不懂的话跳过即可。
提醒:这本书读起来费力,可以帮助你建立跨学科的思维模型,提升认知是一定的,来,硬科学走起。
一、为什么要学数据分析?
看似高深,实则朴素
再好得车,没有方向,是开不到目的地的。不以变现为目的的数据分析都是耍流氓。
如果不能把业务问题转变为数据分析问题,没有相应的数据思维,再怎么神话大数据都无法创造商业价值。
| 如何做呢?
首先,你要有数据。数字不等于数字。科技年代,无论是文字、语音的声音、手机里的照片、视频等等,只要是能被电子化记录的都是数据。
想想看,滴滴把出租车数据化,ofo把自行车数据化,这个社会正在成为大数据时代。
其次,关注数据如何帮助企业创造价值。数据可以帮助企业提高收入,减少支出,管控风险。
提升收入,大数据帮助你的广告精准投放,为企业带去一大波流量,它所创造的收入增长就是数据的价值。
减少支出,比如根据客户的大数据调查,减少某产品的某项功能。
把控风险。比如信用卡的征信系统帮助银行降低风险。
二、什么是数据思维?
回归分析
数据思维是这本书最重要的概念,这里不得不引入一个统计学专有名词——回归分析,即确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
在“道”的层面上,回归分析是一种思维方式,我们可以把公司的“业务问题”定义成“数据可分析问题”。比如做自媒体,想提高粉丝数量这件事儿。
而在“术”的层面,回归分析又是一种可以运用的数据分析工具。比如说,什么关键点影响我拉新?如何影响的?
什么样的问题可以被看作数据可分析问题?你需要找到两种变量:
●因变量Y:因为别人的改变而改变的变量,这是业务的核心诉求。
●自变量X:用来解释因变量Y的相关变量,通俗点说,自变量X的改变,影响了因变量Y的变化。
我们的工作重点是找到业务的核心诉求,而把如何数据分析丢给专业的技术人员去处理。
三、 大数据到底是什么
大数据不神秘
实际上,大数据没有媒体上那么神秘,它与统计学密切相关。
|大数据和统计学的关系:
1.统计学关注数据的分析建模,这对大数据的贡献巨大。
2.大数据并不能代替抽样,相反,越是大数据抽样越重要。(大不代表更准确)
|大数据的准确度如何
“预测不准是常态,预测准确是变态。”王教授这句话,打破了人们对大数据的神化。
科学本质使然。统计学研究中包括了大量的相关关系,和极小一部分的因果关系。
●相关关系:客观现象存在的一种非确定的相互依存关系。例子:公鸡叫,太阳升起来。 但是杀了鸡,太阳就不升起来了吗?
●因果关系:前一件事导致后一件事会发生。例子:按下开机键,电脑亮了。
很明显可以看出,因果关系更重要,如果找到不得了。
四、人人应有数据思维
不具备数据思维,我们就会像不懂区块链去炒币的人一样,容易被收智商税。
|帮企业提高沟通效率
我们在工作中,经常遇到这样的情况:数据部门说的是技术语言,业务部门说的是业务,驴唇不对马嘴,沟通障碍。
要解决这个问题,这不仅需要技术部门的人学着去了解业务,也需要业务部门克服对数据的恐惧。老板要认识到哪些事与数据相关,业务部门要学着讲清楚核心诉求是什么。
这可以大大提高沟通效率,使数据分析的价值最大化!
|抓创业者抓住商业机会
数据思维能帮助创业者抓住商业机会,你需要思考:
1.我所在的创业方向,数据是否能帮助我?
2.如果数据很重要,将业务中的因变量Y和自变量X梳理清楚。
3.在战略层面上,保证Y和X的高质量供给、长时间积累。
|生活中的数据思维
首先,培养数据思维帮你养成一种思考有的放矢的习惯:分析的目的是什么?核心诉求是什么?因变量Y是什么?
其次,搞清楚目的后,你就能将注意力聚焦在相关的自变量X上,就不会陷入“放眼望去都是重点”的迷乱状态中。
最后,你可以尝试最简单的分析,专业的建模暂且不说,至少可以区分一下哪些是相关关系、哪些是因果关系。