如何在 Tableau 中利用 Python 的力量

如何在 Tableau 中利用 Python 的力量,第1张

2016年, Tableau便发布了 TabPy的试用版本,一个可以在 Tableau工作簿中运行 Python代码的新 API 。当你通过 Tableau使用 TabPy时,你可以在 Python中定义计算字段,从而在你的可视化作品中充分挖掘大量机器学习库的潜力。
这个在 Tableau中与 Python的集成应用,为用户提供了强大的解决方案。例如,它只需几行 Python代码就能得到一个线上零售商所售商品的情感分析。然后你可以在 Tableau中从很多方面探索获得的结果。
你可能只想看到负面评价并且希望理解这些内容背后的原因。你可能想得到一个顾客列表,并与他们联系。或者你可能想可视化整体情绪随时间变化的情况。
R/Python整合:Rserve/TabPy Server
你可以很容易在电脑上或者远程服务器上安装 TabPy服务器。在 Tableau Desktop中,通过点击帮助 >设置与性能 >管理外部服务连接,在其中输入服务 URL ,你就可以完成配置。然后你可以使用 Python脚本作为 Tableau中计算字段的一部分,就像从 Tableau 81开始你可以利用 R的那样。
TabPy使用流行的 Anaconda环境,这能够预装和准备许多包括 scipy , numpy和 scikit-learn在内的常见 Python包。你可以在你的脚本中安装使用任何 Python库。
如果在公司里你有一个数据分析团队来开发定制模型, TabPy还可以通过发布模型很方便与其他那些想要在 Tableau中利用模型的人分享。
一旦发布,无论模型的类型与复杂性如何,你就只需要在 Tableau中运行一个只有一行 Python代码来运行该机器学习模型。
使用已发布的模型有几个好处。在预服务环境中,复杂的功能变得容易使用,分享和以部署方式重用。你可以在后端提升和更新模型,或者修改代码,而 Tableau中的计算字段并不需要额外的 *** 作即可保证正常工作。
看到 Python在 Tableau中的应用,你是不是有点手痒了?亟不可待的想尝试一下?小编在这里推荐一篇新手实用教程,如果你以前没有使用过 Python ,不用担心 ——这对新手来说绝对是可以实现的。继续看下去吧!
Python实用案例分享
本次教程使用的数据集来源 Makeover Monday(点击了解详情) ,关于最流行的前100首歌曲的歌词。
1设置你的环境
1 确保你使用的是 Tableau 10版本
2 打开含有 top-song数据的 TDE文件
3 安装 TabPy
2在 Tableau中连接 TabPy
现在是时候在 Tableau中设置 TabPy了。在 Tableau中,转到帮助 >设置和性能 >管理外部连接。输入 “localhost” ,因为你在自己的计算机上运行 TabPy 。默认端口为 9004 ,因此除非你手动更改它,否则应该将其保留。
3创建 TabPy计算
TabPy Github页面具有你应该在 Tableau计算中使用 Python的详细文档。我简单地重新调整了在 #data 16 TabPy部分的一个计算演示。这里可以看重播。复制下方链接至浏览器查看重播:
现在,你可以使用视图中的这个 [Word]计算字段来处理情绪评分了!缺点是,由于这是一个表计算并且还使用了 ATTR函数,因此你不能在一个详细级别表达式中使用它。也就是说,你不能使用这个例子和数据结构来计算歌曲细节级别的情感总和。

用tableau使得数据与地图结合展现:
先要链接打开excel数据源。选择链接到数据,然后选择excel,打开excel文件所在目录。
在tableau当中打开excel后,需要点击“转到工作表”。
将excel数据完全在tableau中展现。可以看到tableau中分维度和度量两种类型数据,其中维度是不可统计数据,度量是可以统计数据。原始数据中的城市理所当然就是维度数据,而人口则就是度量数据。
因为要使用tableau的地图功能,所以首先得将城市这个维度数据变成地理角色。右键“城市”--选择“地理角色”--选择“城市”。确定后会看“城市”旁边有个小地球的标示,说明是成功设置地理角色。
按住ctrl键,同时选择“城市”和“人口”两个字段,可以看到智能显示当中 一些推荐地图标签显示光亮,说明是可以选择状态,随便选择一个地图。
经过短时间的等待,选择的数据已经在中国地图指定位置显示出来了。
可以选择图形、标签、颜色等对生成的地图进行美化。

Tableau Prep 正在被越来越多的数据粉使用,作为专业的数据准备工具,Prep 提供了常用的数据处理功能,例如分组、转置、计算等,还提供了对 R 语言和 Python 脚本的支持。

● 之前分享过栗子: 用 Prep 轻松实现数据去重 、 用 Prep 数据去重的三种场景 、 用 Prep 正则表达式拆分复杂字段 。

不过,有一些复杂的场景,比如:需要计算相关系数,Tableau 本身提供的相关系数计算方法 CORR() 只能一次计算两个字段的相关系数,如果遇到需要建立相关系数矩阵的情况,处理起来就比较麻烦。

这种情况,可以通过 Prep 调用Python 脚本来加速数据清理,实现对多个字段计算皮尔逊相关系数( Pearson correlation coefficient,更多信息可自行了解)。

如何在Prep 调用 Python 脚本?今天的

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13433686.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-05
下一篇 2023-08-05

发表评论

登录后才能评论

评论列表(0条)

保存