声明:本文来自微信公众平台机器之心(ID:almosthuman2014),创作者:PerterNistrup,经百度站长工具授权转载发布。
如何提高数据统计分析能力?彼得·尼斯特鲁普(PeterNistrup)根据自己的工作经验,列举了7种有效的特殊工具。
给出了一些例子来改进或加速通常数据的统计分析,包括:
1.熊猫简介
2.用袖扣和绘图仪绘制熊猫数据信息
3.IPython魔术师的命令
4.Jupyter中的文件格式编辑
5.Jupyter键盘快捷键
6.在Jupyter(或IPython)中制作一个有多个输出的模块。
7.及时建立Jupyter笔记本的ppt
1。熊猫简介
这种专用工具的实际效果是显著的。下图显示了启用df.profile_report()的简单方法的结果:
这个专用工具的应用只需要安装和导入PandasProfiling包。
本文没有详细描述这个特殊的工具。如果您想了解更多信息,请阅读文章:
https://towardsdatascience.com/exploring-your-data-with-just-one-line-of-python-4b35ce21a82d
2。用袖扣和Plotly绘制熊猫数据信息
大多数“有经验”的大数据工程师或大数据分析师对matplotlib和pandas都很了解。换句话说,你可以快速画出一个简单的pd。数据帧或pd。系列,只需启用。plot()方法:
有点无聊?
这已经很不错了,但是有没有可能画出一个交互的、可伸缩的、可扩展的全景图呢?现在是袖扣**出场的时候了!(袖扣根据Plotly做了进一步的包装。)
在自然环境中安装袖扣,在终端设备中 *** 作即可!你pip安装袖扣-升级。查询下图:
实际效果好多了!
注意,图中唯一的变化是袖扣cf.go_offline()的导入和设置,它改变了。plot()模式为。iplot()。
其他方法如。scatter_matrix()也可以产生出色的数据可视化结果:
你必须做大量的大数据可视化工作,能够读懂文章袖扣和Plotly的文本文档,找到大量的方法。
IPython的“魔术师”是IPython根据Python的标准英语语法所做的一系列改进。魔术师命令包括两种方式:行魔术:前缀%和 *** 作在一个单独的打字行;单元格魔术:前缀为%%,它可以在几个打字行上工作。下面的例子展示了IPython魔术师命令的一些有效效果:
%lsmagic:找到所有命令
如果你只记得一个魔术师的命令,那一定是这个。执行%lsmagic命令将显示所有可以使用magic命令的目录:
Bug:交互调试
这大概是我最常用的魔术师指令了。
大多数大数据工程师都遇到过这种情况:实现的代码块不断断裂,你沮丧地写了20个print()语句,试图输出每个自变量的内容。然后,如果你最终修复了这个问题,你必须返回并再次删除所有的print()语句。
但是没必要这样。遇到难题后,只要实现bug命令,就可以实现你要 *** 作的随机编码部分:
图中发生了什么?
%store:转移笔记本中间的参数
这个指挥也很帅。假设你已经花了一些时间清理笔记本中的数据信息,现在你想在另一个笔记本中测试一些功能。是在同一个笔记本上完成功能,还是把数据信息存储起来,加载到另一个笔记本上?应用%store命令后,这种实际 *** 作是不必要的!这个命令将存储自变量,这可以在其他随机笔记本中找到:
你有没有遇到过取了自变量的值后忘记用户标识符的情况?还是不小心删除了假设自变量的值的单元格?使用%who命令,您可以获得所有静态变量的列表:
%%time:守时法术命令
这个命令可以用来获得所有的计时信息。只需对任意可执行代码使用%%time命令,就可以得到以下输出:
%%WriteFile:将单元格内容加载到文档中
当你在notebook中编写复杂的函数或类,并希望将它们存储在一个独占文档中时,这个拼写命令非常有效。您只能将%%writefile前缀和要保存的文件夹的名称添加到函数或类的单元格中:
如上图,我们可以将建立的函数存储在utils.py文档中,然后就可以随便导入了。也可以在其他笔记本中完成,只要和utils.py文档属于同一个文件目录。
4。Jupyter中的文件格式编辑
这个专用工具很帅!Jupyter在markdown中充分考虑了HTML/CSS文件格式。以下是我最常用的功能:
深蓝色,流行趋势:
<div class="alert alert-block alert-info"> This is <b>fancy</b>!</div>鲜红色,轻度恐慌:
<div class="alert alert-block alert-danger"> This is <b>baaaaad</b>!</div>绿色安静:
<div class="alert alert-block alert-success"> This is <b>gooood</b>!</div>下图显示了它们 *** 作的整个过程:
如果你想展示一些对于笔记本文件格式的发现,这个非常有效!
5。Jupyter键盘快捷键
掌握和学习训练快捷键,可以使用命令控制面板:CtrlShiftP获取笔记本所有功能的目录。下面选择了几个基本命令:
6。在Jupyter(或IPython)中使一个模块有几个其他输出
你想给熊猫看数据框。头()和。tail(),但是您不得不中途放弃,因为构建一个额外的可运行的编码模块太不方便了。尾部()。你经历过那种经历吗?现在不要害怕,您可以使用下面的代码行来显示您想要显示的输出:
from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"下图显示了几个输出的结果:
7。及时为Jupyter笔记本制作PPT
有了RISE,只需按一个功能键就能及时把Jupyter笔记本换成ppt。而且笔记本还是活动的,除了ppt演示还可以实现即时编号!
要应用这个专用工具,只需要根据conda或pip安装RISE即可。
conda install -c conda-forge rise或者
pip install RISE现在,您可以点击“新建”按钮为笔记本制作一个非常好的ppt:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)