《数据思维》

《数据思维》,第1张

荐 语

互联网也已成熟,物联网正在搭建。

每个人都生产数据,却只是少数人拥有玩转它的能力。

凭借数据,内行率先开启了先知视角,而我们却连北都摸不着!

从广告的精准投放,到预测并影响美国总统大选,数据为何如此神奇?
一、朴素的数据价值观

1数据的价值

a什么是数据

凡是可以被电子化记录的都是数据。

这不局限于数字,还包括语音输入的声音,数码相机拍下的照片,手机录制的视频等被电子化记录的内容。该定义看似狭隘,但是能帮助我们更好的理解数据产业的变迁,培养数据的时代观。

b数据有什么用

数据之于个人的价值,一定关乎自身业务的核心诉求。只有说清楚了数据的商业价值,客户才容易为数据买单,数据企业才容易产生收入,数据产业中才不会有那么多的困惑。那么,数据的价值是什么呢?

我们可以从收入、支出、风险三个方面看待这个问题:

收入。最典型的是百度付费搜索广告,它通过对用户搜索数据的深入分析,进行精准匹配,为广告主带去一大波流量,它所创造的收入增长就是数据的价值。

支出。根据物联网技术采集到的信息,电视生产商发现某一款电视机的用户中,仅1%的用户还在使用老式的VGA视频接口。于是,他们决定取消这一接口设置,该决定为企业每年节省了上亿元成本。这也是数据分析带来的价值。

风险。很多商业银行都有网上申请系统,风险普遍高于线下面签。数据分析可以帮助它们更加准确地区分哪些线上申请者是好人,哪些是坏人。这是以降低商业风险的方式,数据为公司所带来的间接价值。

2什么是数据思维

为了解释清楚本书中最重要的概念“数据思维”,这里不得不引入一个统计学专有名词——回归分析,即确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

古人云:以道驭术,以术驱道。在“道”的层面上,回归分析是一种思维方式,在它的指导下,我们可以把“业务问题”定义成“数据可分析问题”。而在“术”的层面,回归分析又是一种可以运用的数据分析工具,这在本解读最后一章会介绍。

什么样的问题可以被看作数据可分析问题?你需要找到两种变量:

因变量Y:因为别人的改变而改变的变量,这是业务的核心诉求。

自变量X:用来解释因变量Y的相关变量,通俗点说,自变量X的改变,影响了因变量Y的变化。X表现了数据分析者对业务的洞见。

案 例

假设A君向你借一万元钱,你也许会从A君平时的为人开始分析,顺便考虑你俩关系够不够铁、是否签下借条、A君的家境情况等等各种因素,依此衡量A君还钱的可能性。此处A君还钱的可能性就是因变量Y;而为人、关系、借条、家境都是自变量X。

数据思维是把“业务问题”定义成“数据可分析问题”,具体的做法就是在乱成一锅粥的业务问题中,准确定位业务的核心诉求(因变量Y),并找到影响核心诉求的相关因素(自变量X),然后利用各种数据分析工具进一步研究。

下一章我们着重解决一个问题,为什么拥有数据思维如此重要?

二、 大数据到底是什么

在不了解数据分析的情况下,我们很容易神话大数据,认为它拥有多么神奇的魔力。实际上,大数据没那么神秘,它与许多人接触过的统计学有着千丝万缕的关系。

1大数据和统计学的关系

本期节目中,王汉生教授提到,大数据和统计学至少有两方面的关系:

a统计学关注的核心,是对数据的分析建模,并通过建模对业务不确定性的刻画,这对大数据的贡献巨大。

b大数据并不能代替抽样,相反,越是大数据抽样越重要。

2大数据的准确度如何

“预测不准是常态,预测准确是变态。”王教授这句话,戳破了许多人对预测抱有的美好期待。

为什么对于准确度那么绝望呢?科学本质使然。统计学研究中包括了大量的相关关系,其中只有极小一部分非常稀有的因果关系,但是因果关系的重要性依旧无法取代。

相关关系:客观现象存在的一种非确定的相互依存关系。例子:公鸡叫,太阳升起来。

因果关系:第一个事件(因)和第二个事件(果)之间的作用关系,其中后一事件被认为是前一事件的结果。例子:按下开机键,电脑亮了。

我们经常会混淆这一对概念,甚至有些时候连相关关系都不算的事件A和事件B,由于它们常相伴发生,我们便迷信地以为两者具有因果关系,闹下不少的笑话。

因此,鉴别相关关系和因果关系这一对概念,不仅是我们了解大数据的金钥匙,也是培养科学素养——对伪科学说不——所要迈出的关键一步!

三、人人应有数据思维

数据思维是一种必备的素养。因为生活在信息时代的我们,或多或少都会和数据扯上点关系,不具备数据思维,我们就会像不懂经济学知识炒股的人一样,容易被征智商税啊!

1提高沟通效率

我们在工作中,经常遇到这样的情况:数据专家说的是技术语言,需求部门说的是业务问题(其中包括数据可分析的和不可分析的),双方的沟通总是难以顺利进行。

要解决这个问题,这不仅需要专业人士摆脱自己知识的诅咒,也需要需求部门克服对于数据的恐惧感,公司内部自上而下都有必要培养数据思维。决策者要认识到哪些事与数据相关,需求部门应该有将核心诉求讲清楚的能力。

对此,樊老师生动地形容道,具备数据思维就是“张口就能点出回锅肉”。

这可以大大提高沟通效率,使数据分析的价值最大化!

2抓住商业机会

另一方面,数据思维对于创业者来说也可能有帮助,尤其在那些与数据有着紧密联系的创业项目中。具备数据思维,能帮助创业者抓住商业机会,但这需要经过以下三个步骤:

a我所在的创业方向,数据是否能帮助我?

b如果数据很重要,将业务中的因变量Y和自变量X梳理清楚。

c在战略层面上,保证Y和X的高质量供给、长时间积累。

3生活中的数据思维

假如一个人既不是创业者,所涉及业务问题又和数据分析八竿子打不着,培养数据思维又有什么用呢?事实上,生活中的大部分小事,数据思维都可以给你启发,关键看你怎么用?

首先,培养数据思维帮你养成一种思考有的放矢的习惯:分析的目的是什么?核心诉求是什么?因变量Y是什么?

其次,搞清楚目的后,你就能将注意力聚焦在相关的自变量X上,就不会陷入“放眼望去都是重点”的迷乱状态中。

最后,你可以尝试最简单的分析,专业的建模暂且不说,至少可以区分一下哪些是相关关系、哪些是因果关系。

四、 各种数据分析方法

读到这里,你是否已经对数据分析产生兴趣了呢?本书中还介绍了几种常见的数据分析工具,感兴趣的话可以研究一下,然后试着用它们解决数据可分析的问题。

1回归分析

在“术”的层面,回归分析就是各种各样的统计学模型。它主要有五种类型:线性回归、0-1回归、定序回归、计数回归以及生存回归。

线性回归,更严格地说是普通线性回归,其主要特征是:因变量Y必须是连续型数据,而对解释性变量X没有太多要求。在数据世界中,线性回归可以应用于股票投资、客户终身价值、医疗健康等领域。

0-1回归就是因变量Y是0-1型数据(只有两个可能取值)的回归分析模型。例如,性别只有“男”或“女”。购买决策只有“买”或“不买”。癌症诊断只有“得癌症”或“不得癌症”。0-1回归可以应用于互联网征信、个性化推荐、社交好友推荐等。

定序回归就是因变量Y为定序数据(关乎顺序的数据)的回归分析模型。举个例子,现在请各位书友为本期作者光临打分,根据喜好程度:1表示非常喜欢,2表示有点喜欢,3表示感觉一般,4表示有点不喜欢,5表示非常不喜欢。这就是一种定序数据。定序回归常见的应用场景有:的打分评级(1~5星);电商产品的满意度评分(1~5星)等。

计数回归。如果因变量Y是一个计数数据(非负整数),那么对应的回归分析模型就是计数回归。计数回归常被应用于:客户关系管理中的RFM模型,即一定时间内客户到访的次数;二胎政策研究中,一对夫妻选择生育孩子的数量等。

生存回归是生存数据回归的简称,即因变量Y为生存数据(刻画一个现象或个体存续生存了多久)的回归分析模型,例如人的寿命、电子产品使用年限、创业公司存续时间。

2数据可视化

最基础的数据可视化方法就是统计图,而一张好的统计图应该满足四个标准:准确、有效、简洁、美观。常见的统计图有:柱状图、堆积柱状图、饼图、直方图、折线图、散点图、箱线图、茎叶图等。

3机器学习

机器学习代表着一大类优秀的数据模型分析方法,是立志成为数据科学家的书友们的必修课。它主要涉及的方法有:朴素贝叶斯、决策树(含随机森林)、神经网络(含深度学习)、K均值聚类。

4非结构化数据

数据是结构化的还是非结构化的,这是一个相对的、主观的概念。当然,其中也有一些达成了共识,公认的非结构化数据包括中文文本、数据结构、图像等。

案 例

非结构化的文本数据,并不表示我们不能对它进行数据分析。以《倚天屠龙记》为例,张无忌到底最爱谁,是赵敏吗,是周芷若吗,还是殷离或者小昭?本书利用数据分析的方法,得到了答案!

第一步,把小说的主要人物和他们的称谓提取出来。接下来,要确定分析单位,这里取的是自然段。那么张无忌爱谁这样的问题,到底怎么定义为数据可分析问题呢?本书中从人物出场频次、出场时间、亲密程度等不同角度进行分析,这里简单说一下最重要的亲密程度分析,这是通过她们与张无忌出现在同一自然段的次数(同时出场)刻画的:

所谓日久见真情,从这一个侧面看张无忌与赵敏亲密接触的机会最多,他最有可能爱上的是赵敏。

说明:本案例详情,可从微信公众号狗熊会(ID:CluBear)获得。

结语

这是一本可以提升认知的书籍,没有带给你太多的方法论,也不能让你的生活立即发生改变,甚至你在听书的时候还会感到有些费力。但是,偶尔走出自己的舒适区,尝试理解从前碰都不敢碰的理科问题,然后惊喜地发现“哦!原来是这样啊!”这对于我们来说何尝不是一种进步呢?
作 者 简 介
王汉生

北京大学光华管理学院商务统计与经济计量系教授、博导、系主任,北京大学商务智能研究中心主任,微信公众号“狗熊会”创始人。美国统计学会Fellow(2014),国家杰出青年基金获得者(2016),美国统计学会会刊《JASA》、美国商业与经济统计学杂志《JBES》、泛华统计学会会刊《SINICA》、《中国科学:数学》等多个国际学术期刊的编委(Associate Editor)。

精 华 解 读

以下内容为《数据思维》一书精华解读,供广大书友们学习参考,欢迎分享,未经允许不可用作商业用途。

目 录

一、朴素的数据价值观

二、大数据到底是什么

三、人人应有数据思维

四、各种数据分析方法

正 文

引擎再强大的车,碰到摸不着北的司机,照样开不到目的地。大数据也一样,如果不具备将业务问题转变为数据可分析问题的数据思维,再怎么神话大数据都无法创造商业价值。

大数据很火,真正懂行的少之又少,王汉生教授是其中一位。在聒噪的新媒体语境下,王教授另辟蹊径,以诚恳、求真的学术气质,帮助我们在工作与生活中养成数据思维。

电视投屏连接手机 *** 作如下:

*** 作环境:iOS系统类型的手机、移动无线网、红米 X50 2022款电视等。

1、打开设置确保手机与电视使用的是相同的网络。

2、返回桌面从底部向上划打开手机控制中心。

3、选择AirPlay屏幕镜像。

4、选择想要投屏的电视即可。

投屏的发展

智能电视产业跨过十年历程,从起势到成势之间,投屏技术贯穿着智能大屏的发展。2022年在工作、生活、出行各场景大屏化,在长短视频平台争夺大屏流量增量,疫情拉动客厅大屏需求的背景下,投屏已然成为国民必备技能。

不仅如此,伴随着互联网、5G、物联网、移动芯片、显示技术等领域的跨越式发展,智能设备迎来了爆发,也赋予了投屏技术生态连接者的全新使命。

紧握住从SaaS通往万物互联生态金钥匙的投屏技术也吸引了众多领域的高端玩家参与其中,例如视频平台、硬件品牌厂家、电信运营商等企业均在投屏赛道有所布局。

1、城市轨道交通是城市公共交通的主干线,客流运送的大动脉,是城市的生命线工程。建成运营后,将直接关系到城市居民的出行、工作、购物和生活。

2、城市轨道交通是世界公认的低能耗、少污染的“绿色交通”,是解决“城市病”的一把金钥匙,对于实现城市的可持续发展具有非常重要的意义。

3、城市轨道交通是城市建设史上最大的公益性基础设施,对城市的全局和发展模式将产生深远的影响。为了建设生态城市,应把摊大饼式的城市发展模式改变为伸开的手掌形模式,而手掌状城市发展的骨架就是城市轨道交通。

城市轨道交通的建设可以带动城市沿轨道交通廊道的发展,促进城市繁荣,形成郊区卫星城和多个副部中心,从而缓解城市中心人口密集、住房紧张、绿化面积小、空气污染严重等城市通病。

4、城市轨道交通的建设与发展有利于提高市民出行的效率,节省时间,改善生活质量。国际知名的大都市由于轨道交通事业十分发达方便,人们出行很少乘私人车辆,主要依靠地铁轻轨等轨道交通,故城市交通秩序井然,市民出行方便、省时。

扩展资料:

城市轨道交通的政策支持:

2016年3月28日,国家发展改革委、交通运输部联合印发《交通基础设施重大工程建设三年行动计划》(简称《行动计划》)。《行动计划》指出,在2016年至2018年的三年间,将重点推进铁路、公路、水路、机场、城市轨道交通项目303项涉及项目总投资约47万亿元;

以完善快速交通网、基础交通网、城际城市交通网为重点,推动形成国内国际通道联通、区域城乡覆盖广泛、枢纽节点功能完善、一体衔接便捷高效的综合交通网络,更好发挥组合优势和网络效益。

其中,铁路和城市轨道交通项目是建设“重头戏”,重点推进103个城市轨道交通前期工作,新建城市轨道交通2000公里以上,涉及投资约16万亿元。

2019年9月24日,在《交通强国建设纲要》新闻发布会上,国家铁路局表示,到2050年,将最终形成运输保障能力强大、战略支撑有力、运输服务高效、资源环境友好的功能完善、服务一流、绿色环保的现代化铁路网。

在基础设施布局方面,推进干线铁路、城际铁路、市域(郊)铁路、城市轨道交通融合发展,构建高质量发展的铁路网络和综合交通枢纽建设。

参考资料来源:百度百科-城市轨道交通

参考资料来源:百度百科-轨道交通


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/12917396.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存