工作两年,想转行做数据分析,不知道路怎样走

工作两年,想转行做数据分析,不知道路怎样走,第1张

如何转行数据分析师

近年来,各大平台开始炒起了“数据分析”热,导致有不少小伙伴来问我:做数据分析师有那么好吗?如何转行做数据分析师?学数据分析难不难?

我想首先澄清一个概念:“转行”。对于从未接触数据分析领域或者大数据领域的童鞋而言,“转行”这个词其实是不够准确的,大部分的童鞋还是符合“入行”这个词。就我看来,字面意义的“转行”更像是平行概念,似乎是在同一个水平面,走到街转角,然后右转,便到了另一番天地。

但是实际的“转行”是远比这残酷的。

“转行”的第一个动作一定是放弃和下沉。放弃你现在所拥有技能带给你现在的地位和薪资,是走下现在的台阶,到达更低的台阶,然后再往上攀登的过程。也就是说:没有放弃和下沉,你谈不上是在转行。如果你要转行,一定要意识到转行的残酷性。

很好,你已经意识到转行的残酷了。你放弃了现有的,也心态和身体都下沉做好了起跑的准备了。下一步,就是精准地找到那扇门:进入数据分析师世界的大门。

注意“精准”这个词。那一定是旁边那些形形色色的门你都不选,而选了唯一的这一扇门。为了找到这扇门,你经过了无数次的百度搜索,论坛搜知识点,然后在判别上去伪存真,最终找到了进入数据分析师这条正确的大门。

     

     

那如何找到这扇门呢?

高度概括就两件事:工具+方法论。工具从初级到高级的排序是:Excel, MySQL, BI, Python, 算法等。

你需要做以下几件事:

1. 掌握数据分析工具

A. 基础工具:excel

excel能够帮助你实现数据透视并可视化,只需用到其中部分功能即可完成日常量数据的计算工作。

B. 提取数据工具:MySQL

MySQL数据库中包含基本的增、删、改、查等语法,你可以利用它对数据进行清洗和规范化。

C. 分析工具:python

爬取数据,并对数据进行分析和挖掘收集,python有非常丰富的库去访问网页文档的api以及后期网页文档的快速处理。

D. 可视化工具:excel、PPT、FineBI

可视化就是将原本比较抽象的数据用图表的方式呈现出来,使数据变得更加清晰,便于理解。excel和PPT就是相当常用的可视化工具。

E. 机器学习或神经网络等算法

算法的作用就是把事物的已有特征跟这件事的结果,这个“特征x”和“结果y”之间建立一个数学公式之间的联系。从无数个已知的x,y之中找到x,y最优的关系的数学公式,最终找到一个数学公式能在已知很多x的情况下,预测它的y值。这个听起来或许没那么直观。但是它的应用是极其广泛的。比如:如果已知各个森林的各种实时数据,就能够知道哪个森林更容易着山火,下次就避免这种山火。

2. 掌握数据分析方法论

这个就是结合到公司的业务要找到最符合公司的数据分析模型。通常每一个特定行业都有业务分析习惯使用的模型,例如电商中常使用的分解因子分析,漏斗分析等;零售行业常用RFM模型;教育行业常用时间趋势分析,描述性统计分析,人物画像分析等。每个行业所对应的数据运营模型甚至是算法,都会是定制化的,个性化的,但是这背后都会有通用逻辑。掌握这些通用逻辑,是数据分析师在业务模型上变通的基础。也就像是学习篮球,你先得学会基本运球技巧,熟练左右手上篮,然后再在实战中练习传球,走位等等。掌握通用技能就是练习左右手上篮以及运球技巧,在实际业务中运用模型也就是练习走位和传球。对于想入行的零基础学员来说,掌握数据分析通用方法论是极其重要的。

然而,没有人是能够一蹴而就就掌握好这么多工具和方法论的。所有的远航都得有一个开始的远点,入门数据分析师也一样。

一开始,你可能只是学习成为初级数据专员。这要求你熟练掌握excel、PPT,会做VBA、会做透视表、会使用基本公式,这样你已经能做很多传统公司的数据专员了。第二阶段是要会SQL、懂业务,能够做一些基本的数据处理,再加上上一阶段的那些技能,你就能做大部分公司的数据运营和数据产品。然后是专业的数据分析师,你要非常熟悉统计学,回归、假设检验、时间序列等等,还要会做数据可视化,掌握了这些技术,就足以应付大多数的互联网业务。最高阶的就是数据科学家,到了这个阶段,已经成为了数据分析师中的王者,要求你精通统计学,会使用机器学习,比如调参数和优化,而取数、数据仓库、可视化什么的,对你来说就是小菜一碟。

其实,数据分析已经逐渐成为了职场中的必备技能,无论你是不是想要成为一名数据分析师,数据分析都应用在我们生活中的方方面面。学习数据分析能够充分发挥你在工作中的超强能力,如果你想要有更系统的学习方案和职业规划,欢迎加入【聚数学院】~

其实题主需要搞清楚以下几个问题,搞清楚了,其实问题的答案也就有了:

1、是从个人学习成长的角度想搭建平台自学?还是现在的公司需要大数据技术进行分析?——如果是从个人学习成长的角度,建议直接按照Hadoop或者Spark的官网教程安装即可,建议看官网(英文),在大数据技术领域,英语的掌握是非常重要的,因为涉及到组件选型、日后的安装、部署、运维,所有的任务运行信息、报错信息都是英文的,包括遇到问题的解答,所以还是非常重要的。如果是公司需要进行大数据分析,那么还要研究以下几个问题:为什么需要搭建大数据分析平台?要解决什么业务问题?需要什么样的分析?数据量有多少?是否有实时分析的需求?是否有BI报表的需求?——这里举一个典型的场景:公司之前采用Oracle或MySQL搭建的业务数据库,而且有简单的数据分析,或者可能采购了BI系统,就是直接用业务系统数据库进行支持的,现在随着数据量越来越大,那么就需要采用大数据技术进行扩容。

搞清楚需求之后,按照以下的步骤进行:

1、整体方案设计;整体方案设计时需要考虑的因素:数据量有多少:几百GB?几十TB?数据存储在哪里:存储在MySQL中?Oracle中?或其他数据库中?数据如何从现在的存储系统进入到大数据平台中?如何将结果数据写出到其他存储系统中?分析主题是什么:只有几个简单指标?还是说有很多统计指标,需要专门的人员去梳理,分组,并进行产品设计;是否需要搭建整体数仓?是否需要BI报表:业务人员有无 *** 作BI的能力,或团队组成比较简单,不需要前后端人员投入,使用BI比较方便;是否需要实时计算?

2、组件选型;架构设计完成后就需要组件选型了,这时候最好是比较资深的架构师参与设计,选型包括:离线计算引擎:Hadoop、Spark、Tez……实时计算引擎:Storm、Flink、Samza、Spark

Streaming……BI软件:Tableau、QlikView、帆软……

3、安装部署;选型完成后,就可以进行安装部署了,这部分其实是最简单的,直接按照每个组件的部署要求安装即可。

4、另一种选择:采用商用软件如果是企业需要搭建大数据平台,那么还有一种选择是直接采用商用的数据平台。市面上有很多成熟的商用大数据平台,Cloudera、星环、华为、亚信等等,都有对应的产品线,像我们袋鼠云就有一款非常优秀的大数据平台产品:数栈。主要有以下几个特点:

1.一站式。一站式数据开发产品体系,满足企业建设数据中台过程中的多样复杂需求。

2.兼容性强。支持对接多种计算引擎,使更多企业“半路上车”。

3.开箱即用。基于Web的图形化 *** 作界面,开箱即用,快速上手。

4.性价比高。满足中小企业数据中台建设需求,降低企业投入成本。

可以了解下。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/7313971.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-04
下一篇 2023-04-04

发表评论

登录后才能评论

评论列表(0条)

保存