编者按:数据科学家是21世纪的热门工作。工欲善其事必先利其器。数据分析工具何其多,究竟用哪样才合适?Lewis Chou在Medium上分析了3类6种工具的特点和适用场景,看完这篇文章,相信你就可以知道了。原文标题是:Top 6 Data Analytics Tools in 2019
说到数据分析工具,我们总是有疑问。那么多的数据分析工具,它们之间究竟有什么区别?哪个更好?我应该学习哪一个?
尽管这是一个老生常谈的话题,但它确实很重要,我一直在努力寻找这个终极问题的答案。如果你到网上搜索这个领域的相关信息的话,很难找到公正的看法。因为特定数据分析工具的评估者可能会从不同的角度出发,并带有一些个人感受。
今天,让我们撇开这些个人感受。我会尝试跟大家一起客观地谈谈我对市场上数据分析工具的个人看法,以供参考。
我总共选择了三类共6种工具。接下来我会一一进行介绍。
Excel具备多种强大功能,比如创建表单,数据透视表,VBA等,Excel的系统如此庞大,以至于没有任何一项分析工具可以超越它,确保了大家可以根据自己的需求分析数据。
但是,有些人可能以为他们非常精通计算机编程语言,然后鄙视用Excel作为工具,因为Excel无法处理大数据。但是请考虑一下,我们日常生活中使用的数据是不是超出了大数据的限制?在我看来,Excel就是一款全能型的播放器。它最适合小型数据,而且通过插件还可以处理数百万的数据。
综上所述,基于Excel的强大功能及其用户规模,我认为它是必不可少的工具。如果你想学习数据分析,Excel绝对是首选。
商业智能是为数据分析而生的,它诞生的起点很高。其目的是缩短从商业数据到商业决策的时间,并利用数据来影响决策。
Excel的产品目标不是这样。Excel可以做很多事情。你可以使用Excel画课程表,制作问卷或用作计算器,甚至可以用来画画。如果你会VBA,还可以制作小型 游戏 。不过这些并不是真正的数据分析功能。
但是BI工具就是专门用于数据分析的。
以常见的BI工具(例如Power BI,FineReport 和Tableau)为例。你会发现它们都是按照数据分析流程设计的。先是数据处理,数据清洗,然后是数据建模,最后是数据可视化,用图表来识别问题并影响决策。
这些是数据分析的唯一方法,并且在这个过程中存在一些员工的痛点。
比方说,可以用BI工具来简化重复的低附加值的数据清洗工作。
如果数据量很大,传统工具Excel是无法完成数据透视表的。
如果我们用Excel来进行图形显示,会需要花费大量时间来编辑图表,包括颜色和字体设置等琐事。
这些痛点是BI工具可以为我们带来变化和价值的地方。
现在,让我们比较一下市场上的三种流行的BI工具:Power BI,FineReport 和Tableau。
1 )Tableau
Tableau的核心本质实际上是Excel的数据透视表和数据透视图。可以说Tableau敏锐地意识到了Excel的这一功能。它进入BI市场较早,并延续了这一核心价值。
从发展 历史 和当前市场反馈的角度来看,Tableau的可视化效果更好。我不认为这是因为它的图表有多酷,但是它的设计、颜色和用户界面给我们一种简单而新鲜的感觉。
确实,这就像Tableau自己的宣传一样,他们投入了大量的学术精力来研究大家喜欢哪种图表,以及如何为用户提供 *** 作和视觉上的终极体验。
此外,Tableau还增加了数据清洗功能和更智能的分析功能。这也是Tableau可以预期的产品开发优势。
2)Power BI
Power BI的优势在于其业务模型和数据分析功能。
Power BI以前是Excel的插件,但是发展并不理想。因此它摆脱了Excel,发展成BI工具。作为后来者,Power BI每个月都有迭代更新,并且跟进的速度很快。
Power BI当前具有三种授权方式:Power BI Free、Power BI Pro以及Power BI Premium。与Tableau一样,免费版的功能也不完整。但是给个人用几乎已经足够。而且Power BI的数据分析功能强大。它的PowerPivot 和DAX语言让我能够以类似在Excel中编写公式的方式来进行复杂的高级分析。
3)FineReport应用
FineReport之所以独特在于它的自助服务数据分析非常适合企业用户。只需简单的拖放 *** 作,你就可以使用FineReport 设计各种样式的报告,并轻松构建数据决策分析系统。
FineReport 可以直接连接到各种数据库,并且方便快捷地自定义各种样式,从而制作周报、月报和季报、年报。其格式类似于Excel的界面。功能包括报告创建,报告权限分配,报告管理,数据输入等。
此外,FineReport 的可视化功能也非常突出,它提供了多种仪表板模板和许多自行开发的可视插件库。
在价格方面,FineReport 的个人版本是完全免费的,并且所有功能都是开放的。
R和Python是我要讨论的第三类工具。尽管像Excel和BI工具这样的软件已尽最大努力考虑到数据分析的大多数应用场景,但其实它们基本上都是定制化的。如果软件没有设计某项功能或替某功能开发按钮,那很可能你就没法用它们来完成工作。
在这一点上面,编程语言是不一样的。它非常强大和灵活。你可以编写代码来执行所需的任何 *** 作。比方说,R和Python是数据科学家必不可少的工具。从专业的角度来看,它们绝对比Excel和BI工具强大。
那么,R和Python可以实现哪些Excel和BI工具难以实现的应用场景呢?
1)专业统计分析
就R语言而言,它最擅长的是统计分析,例如正态分布,使用算法对聚类进行分类和回归分析等。这种分析就像用数据作实验一样。它可以帮助我们回答以下问题。
比方说,数据的分布是正态分布、三角分布还是其他类型的分布?离散情况如何?它是否在我们想要达到的统计可控范围内?不同参数对结果的影响的大小是多少?还有假设仿真分析。如果某个参数发生变化,会带来多大影响?
2)独立预测分析
比方说,我们打算预测消费者的行为。他会在我们的商店停留多长时间?他会花多少钱?我们可以找出他的个人信用情况,并根据他的在线消费记录确定贷款金额。或者,我们可以根据他在网页上的浏览 历史 推送不同的物品。这也涉及当前流行的机器学习和人工智能概念。
以上比较说明了几种软件之间的区别。我想概括的要点的是,存在就是合理。Excel,BI工具或编程语言存在部分功能重叠,但它们也是互补的工具。每个应用的价值取决于要开发的应用的类型和当时的情况。
在选择数据分析工具之前,你必须首先了解自己的工作:你会不会用到我刚刚提到的应用场景。或考虑一下你的职业方向:你是面向数据科学还是业务分析的。
译者:boxi。
如下:
tableau 的数据源发布到 tableau server上面去了以后,就不能修改数据。 只能把数据源下载下来
在修改本地的数据源,然后在修改发布到tableau server上面去。
下载的方法,可以在tableau server 上面下载,也可以本地的tableau desktop 点击数据源,选择自己的数据源。就有下载按钮了,点击下载下来后,在选择自己的工作表,就会发现有了另一份本地的副本数据源,然后更换数据源,把原来的数据 关闭掉。就可以修改本地数据源了。
一、BI(商务智能)与Tableau
Tableau=敏捷商务智能(Business Inteligence,BI)+ 数据可视化
1、传统BI系统架构
底层:数据源
中层:ETL(抽取、转换、装载)
上层:数据仓库形成DWD(明细数据层)
IT人员根据预先定义好的分析需求,对明细数据进行汇总、建模形成DWA(汇总数据层)
前端:报表展现工具
2、Tableau--数据可视化
数据可视化:指借助于图形化手段,清晰、有效地传达与沟通信息
Tableau的核心是其数据可视化技术,主要包括两方面:
独创的VizQL数据库
用户体验良好且易用的表现形式
二、Tableau主要特性
1、极速高效
传统BI:ETL过程处理数据→数据分析有延迟性
Tableau:
内存数据引擎:直接查询外部数据库、动态从数据仓库抽取数据→提高数据访问和查询效率
拖放数据列:由VizQL转化成查询语言,支持下钻/上卷查看数据,使用筛选器/组/分层结构变换分析角度→灵活、高效的即时分析
2、简单易用
3、可连接多种数据源,实现数据融合
支持访问多数据源:带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库、多维数据库等
支持数据源切换、并用
支持创建联接(关系数据库/文本文件时):左联接、右联接、内连接等
4、 高效接口集成,良好可扩展性
Tableau提供多种应用编程接口:数据提取接口、页面集成接口、高级数据分析接口
数据提取API(数据提取):通过该接口可在C/C++/Java/Python中创建用于访问和处理数据的程序→创建Tableau数据提取(tde)文件
JavaScript API(页面集成):通过该接口可把由Tableau制作的报表和仪表盘嵌入到已有的企业信息化系统或企业商务智能平台中,实现与页面&交互的集成
与数据分析工具R的接口(数据分析):支持与R的脚本集成
三、Tableau的产品体系
四、Tableau的工作区
Tableau工作区是制作视图、设计仪表板、生成故事、发布和共享工作簿的工作环境
(一)基本概念
工作表(work sheet):又称为“视图”(visualization),是可视化分析的最基本单元
仪表盘(dashboard):是多个工作表和一些对象的组合,可按一定方式对其进行组织、布局,以便解释数据关系和内涵
故事(story):是按顺序排列的工作表/仪表板的集合,故事中各个单独的工作表/仪表板称为“故事点”;创建故事用以向用户叙述某些事实,或以故事方式揭示各种事实之间的上下文或事件发展的关系
工作簿(workbook):包含一个/多个工作表,以及一个/多个仪表板和故事,是用户在Tableau中工作成果的容器
1、数据窗口
2、分析窗口
3、页面卡、筛选器卡、标记卡、图例
4、行&列、视图区、智能显示、标签栏、状态栏
(三)仪表板工作区
仪表板工作区使用布局容器把工作表和一些像、文本、网页类型的对象按一定的布局方式组织在一起
(四)故事工作区
一般将故事用作演示工具,按顺序排列视图或仪表板。
五、Tableau的菜单栏&工具栏
见思维导图
六、Tableau的文件管理
以上就是关于2019年最好的六个数据分析工具全部的内容,包括:2019年最好的六个数据分析工具、tableau数据无法更新怎么解、tableau的原理等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)