数据可视化,到底该用什么软件来展示数据

数据可视化,到底该用什么软件来展示数据,第1张

1使用你最熟悉的软件
学习用编程建立数据可视化不代表要摒弃你已经熟悉的工具。我一般使用任何能够最快速解决问题的工具,这个工具可以是Excel,GoogleSheets,或者是Python。
你不需要只用R或者只用JavaScript做完所有工作,在一项工作中囊括不同的工具是有好处的。你的最终目的是制作可视化图表,每一步的结果会引导你进行到下一步,所以不要太纠结于用“正确”的方法做事。
2从基础做起
不要期待你第一次尝试就会做出非常高级非常惊艳的视觉效果。尤其在学习的初期,你是有很多路要走的,所以要从基础做起,再慢慢去使用更加高级的技巧。这样你才不会一开始就感到备受打击,从而放弃学习的希望。
在R语言中,有很多工具包可以帮助你做事情,甚至有时候你只要使用一个函数就行了。但是如果你不熟悉R的编程句法,我还是建议你从最基本的R语言学起,即便可能会有些难。
就好比我之前提到的d3js这个JacaScript函式库,如果你不熟悉JavaScript,或者刚刚开始学习编程,很多类似的东西都会看起来很难。我建议你从MikeBostock写的基础教程学起,慢慢开始了解你做的东西。
3找一个项目去完成
不要认为要把所有的东西学完再开始做项目,这样你会被耽搁。先学习一些基础知识就可以开始了,这至少可以保证,日后当你遇到问题在网上搜索的时候,能够看懂那些解决方法。
选择一些数据,然后开始着手尝试可视化吧。一开始的进展肯定非常缓慢,你也会觉得很困惑,这都是很正常的。我直到现在还经常因为一些问题感到困惑,但你一定要坚持做完。
做项目的受益之处,在于它逼着你去学习你需要知道的。你每做完一个项目,下一个就会变得容易一些了。
通常一个数据可视化的项目会分成以下的步骤。
处理和格式化数据
Python
当我有一个非矩形分隔的文件 ,或数据比较凌乱时,我会写一些特别的Python脚本。幸运的话,我会找到并重新利用过去已有的脚本。有时会用Beautiful Soup来修饰,有时会用csvkit 。
R
我只有在需要加载csv格式表格时才会用到R,通常只是做数据聚合,合并,或处理从原来的数据中派生的部分。
Tabula
多用于公开的政府数据,包括在 PDF文件中涉及的数据。没有 Tabula的话这个过程将非常痛苦。
Microsoft Excel
只有在有需求的时候才会用到它。数据读入Excel中,然后再导入像Numbers或是OpenOffice这样的工具中。
Google Sheets
有时使用电子表格比写脚本更快,我很喜欢这样简洁的过程。
分析数据
在你去做最后的图形之前,你需要先了解这个数据集。
R
这里我想到的是R。因为R作为一个开源的统计计算语言,它有一个很丰富的社区,数不尽的扩展包,以及在Stack Overflow上大量的已解答的问题。
制作静态图形
这对我来说通常包含两个阶段:(i)在R中进行可视化; (ii)在Illustrator中润色。
R
在R中有可视化工具包,如ggplot2,但我几乎全部使用R自带的那些功能,即base R。
Adobe Illustrator
如果图形要发布给别人看,我会以PDF格式保存R生成的图形,并在Illustrator中编辑。虽然有些矫枉过正,但效果还不错。我也在考虑试着用Sketch。
制作交互式图形
Flash已经过时了,而JavaScript是新的宠儿。R在这里应用不广。
d3js
我用数据驱动的文档来做交互式的数据可视化(我还在学习中)。有许多例子可以用来试手。但如果我想快速完成一个图表,我有时也会尝试用 Vega-Lite 。
4认真阅读编程指南和范例
编程指南是很有用的。一开始可能会有些难,但你必须要适应。如果你的程序出了问题,很大可能是因为你写的不对,而不是代码的实现有问题。所以这个时候你就需要仔细阅读指南,确认你的函数运用是正确的。
在R语言中,所有函数的指南都是用相同的格式写的,它会告诉你这个函数有哪些参数,返回值是什么,并且之后会给出使用的范例,这些范例都非常经典。
d3js函式库的创建者MikeBostock就写了非常好的指南,在网上也有很多其他教程。Bostock在指南中收录的大量范例是非常有用的,每当我遇到问题,在网上搜索解决方法的时候,我一般都会把出现的问题和“mbostock”放在一起搜索。
5着手去做
我有时会也会因为想太多而迟迟不开始,但是只要你能着手按照以上的小提示去做,能节省很多时间。用工具进行数据可视化,一般会有一个最优的做法,但没有必要从一开始就去寻找它。先把形状和颜色在屏幕上试下,然后将数据编译进去,让数据在大体上看起来没问题。如果有些不对劲(尤其是对于含有互用和动画的可视化项目),你再去寻求更优化的做法。一般情况下,即使不是最优,你的图表也是没错的。

市面上打着BI的旗号,实际却只是单纯数据工具的产品不少,大家在进行BI 选型时,眼花缭乱,不知所措。我从技术来源上可以将市面上的BI工具做个简单分类,方便了解。
1、基于直接连接业务系统出报表的报表工具(OLTP应用)
代表厂商是润乾报表,后来是帆软FineReport。
此类报表工具的优势是开发比较灵活,同时含数据填报和补录功能;不足是非基于OLAP的BI报表工具,导致不支持基于多维的报表 *** 作,比如基于同一维度的钻取表,就需要做多张表,通过链接的方式来实现;同时,由于做表前要通过sql语句锁定和加载分析的源数据,不能充分使用数据库的性能,因此大数据量下的计算性能和高并发下的性能是其最大的弱项。
也正因为此类报表这些不足,润乾新一代产品集算器定位在源数据库与报表的中间层,致力于解决数据库到报表的计算性能问题。帆软推出FineBI,试图通过BI技术解决相关问题,但由于基于OLAP技术的积累时间较短,其直连数据库的实现直到今年年初才发布,还有待进一步验证。
2、基于DW/BI理论的传统BI工具
国外代表厂商: IBM收购的Cognos、Oracle的BIEE和SAP收购的BO
国内代表厂商: 亿信华辰的亿信ABI、思迈特的SmartBI
这类分析工具,较好地解决了多维报表 *** 作问题以及性能问题。但国外工具在中国式的复杂报表实现上处于弱势,同时由于BI工具偏应用层,各项目中不可避免有些定制和二次开发的需求,国外公司在此类问题上基本上无法响应。由于基于OLAP技术,因此BI工具本身不能提供数据的修改和补录相关功能,国外工具在这种场景下就捉襟见肘。
亿信华辰是国内成立较早的一批BI厂商,客户遍及政府、银行、电力、税务、租赁等行业,服务国税总局、进出口银行、国家电网、海尔集团等众多政企用户,行业影响力可见一斑。亿信ABI脱胎于2003年发布的单机版数据分析系统,从BI@Report,到亿信BI,再到如今的亿信ABI,历经四次架构跃进,二十多次重大版本更新,十余年技术沉淀,产品功能和性能基本上可以与国外类似工具一较高低。
这类工具国内还有一个典型代表厂商思迈特(SmartBI)。思迈特团队对DW/BI有比较多的实践经验,但由于一些历史原因,最终把产品发展成一个基于Excel做设计器的报表工具和一个面向业务使用的自助分析工具。基于Excel做报表设计器,一是无法实现在线设计与共享,二是也不符合国家对某些领域要求的自主安全可控的发展方向,同时由于对标FineReport,未能很好地解决报表工具固有的缺点。
3、面向业务人员使用的敏捷BI工具。
国外代表厂商:Tableau
国内代表厂商:帆软FineBI、亿信华辰豌豆BI
随着技术和市场的发展,有很多公司开始研发直接面向业务用户的敏捷BI工具。国外有代表性的是Tableau,Tableau一开始的产品定位就是为了替代Excel,单机用户在本地完成各种快速的设计与分析 *** 作,重点强调与数据的互动,以及各种分析方式的 *** 作互动。这类工具由于其定位问题,在制作各种复杂的统计报表的能力天然不足。
国内也有很多的厂商做敏捷BI,比如帆软的FineBI、亿信华辰的豌豆BI。第一个版本的FineBI由于严重依赖FineReport技术,因此其第一个版本的BI更想定位为传统BI工具,重点解决多维分析的能力,但从市场反馈来说,无法做到与FineReport的明显区分,因此其后续版本的BI逐步趋向于敏捷BI工具。但由于其在OLAP技术上的经验很少,还是需要把分析数据打包成的专用数据包,然后BI工具基于专用数据包进行分析,这个专用数据包的作用相当于帆软自有的数据分析模型(类似于OLAP数据库或者cube的作用),需要自己完成对数据分析模型的管理和维护。直到最近,其才发布能够直连OLAP数据库的引擎,相关能力还需要项目上的进一步验证。
亿信华辰在共用核心OLAP引擎技术上单独发展了一个面向业务人员使用的豌豆BI,定位为更简单,更易上手的自助分析BI,其中采用了很多智能化技术提供产品的自动化,让用户 *** 作更加简便,比如数据表导入时的自动建模技术,数据画像功能,多表的自动关联技术,图表智能化推荐技术,以及图表动态自动关联技术等。
4、基于互联网技术和资源的创业型BI
代表厂商:阿里云的QuickBI、网易有数、海致BDP、神策数据等
由于很多人都看好BI的市场和应用场景,因此有些互联网公司在自身应用的基础上开发了BI产品,如阿里云的QuickBI,以及网易有数等,这些工具属于轻量级的工具,其业务地位在公司属于边缘业务,因此得不到重视和发展。
还有些从互联网公司出来的创业团队创立的公司,如海致BDP和神策等,这些公司的产品重点是基于saas或者某类业务应用场景的BI应用。因此这类BI工具的通用性上还需要更多的时间验证。

商家通过翼码开通小程序商城,有完整的数据看板,包括商城/单品转化漏斗分析、商城用户画像输出、新用户订单转化分析、周期性的活动报表、订单结算数据报表、导购业绩排 行榜、导购分佣结算报表等等。

实时的业务看板和探索式的商业智能是目前数据可视化最常见的两个应用场景。
对于企业而言,传统的商业智能产品或报表工具部署周期很长,从设计、研发、部署到交付,往往需要数月甚至更长的时间,IT部门也需要为此付出很大精力;对于决策者而言,想要了解业务发展,不得不等待每周或每月的分析报告,这意味决策周期将更加漫长。
在商业环境快速变化的今天,每周或每月的分析报告显然无法满足企业快节奏的决策需求,企业负责人首先需要的是实时的业务看板。
实时业务看板,意味着可视化图表会随着业务数据的实时更新而变化。一方面,这使得企业决策者可以第一时间了解业务的运营状态,及时发现问题并调整策略;另一方面,实时的数据更新也大大提高了分析人员的工作效率,省去了很多重复式的数据准备工作。
以上由DataHunter为您整理。

Smartbi作为成熟的大数据分析平台,具备可复用、 动静结合独特的展示效果,使得数据可视化灵活强大,动静皆宜,为广大用户提供了无限的应用能力和想象空间。

除了支持使用Excel作为报表设计器,完美兼容Excel的配置项。支持Excel所有内置图形、背景图、条件格式等设计复杂的仪表盘样式,同时支持完整ECharts 图形库,支持各种各样的图形,包含瀑布图、关系图、雷达图、油量图、热力图、树图等几十种动态交互的图形,借助于地理信息技术,还打造了地图分析功能。

商业智能的意思。
商业智能(BusinessIntelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。
商业智能的概念在1996年最早由加特纳集团提出,加特纳集团将商业智能定义为:商业智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/13352232.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-20
下一篇 2023-07-20

发表评论

登录后才能评论

评论列表(0条)

保存