7个Python特殊技巧,助力你的数据分析工作之路

7个Python特殊技巧,助力你的数据分析工作之路,第1张

7个Python特殊技巧,助力你的数据分析工作之路

声明:本文来自微信公众平台机器之心(ID:almosthuman2014),创作者:PerterNistrup,经百度站长工具授权转载发布。

如何提高数据统计分析能力?彼得·尼斯特鲁普(PeterNistrup)根据自己的工作经验,列举了7种有效的特殊工具。

给出了一些例子来改进或加速通常数据的统计分析,包括:

1.熊猫简介

2.用袖扣和绘图仪绘制熊猫数据信息

3.IPython魔术师的命令

4.Jupyter中的文件格式编辑

5.Jupyter键盘快捷键

6.在Jupyter(或IPython)中制作一个有多个输出的模块。

7.及时建立Jupyter笔记本的ppt

1。熊猫简介

这种专用工具的实际效果是显著的。下图显示了启用df.profile_report()的简单方法的结果:

这个专用工具的应用只需要安装和导入PandasProfiling包。

本文没有详细描述这个特殊的工具。如果您想了解更多信息,请阅读文章:

https://towardsdatascience.com/exploring-your-data-with-just-one-line-of-python-4b35ce21a82d

2。用袖扣和Plotly绘制熊猫数据信息

大多数“有经验”的大数据工程师或大数据分析师对matplotlib和pandas都很了解。换句话说,你可以快速画出一个简单的pd。数据帧或pd。系列,只需启用。plot()方法:

有点无聊?

这已经很不错了,但是有没有可能画出一个交互的、可伸缩的、可扩展的全景图呢?现在是袖扣**出场的时候了!(袖扣根据Plotly做了进一步的包装。)

在自然环境中安装袖扣,在终端设备中 *** 作即可!你pip安装袖扣-升级。查询下图:

实际效果好多了!

注意,图中唯一的变化是袖扣cf.go_offline()的导入和设置,它改变了。plot()模式为。iplot()。

其他方法如。scatter_matrix()也可以产生出色的数据可视化结果:

你必须做大量的大数据可视化工作,能够读懂文章袖扣和Plotly的文本文档,找到大量的方法。

  • 袖扣文本文档:https://plot.ly/ipython-notebooks/cufflinks/

  • Plotly文本文档:https://plot.ly/

    3。IPython魔术师的命令

    IPython的“魔术师”是IPython根据Python的标准英语语法所做的一系列改进。魔术师命令包括两种方式:行魔术:前缀%和 *** 作在一个单独的打字行;单元格魔术:前缀为%%,它可以在几个打字行上工作。下面的例子展示了IPython魔术师命令的一些有效效果:

    %lsmagic:找到所有命令

    如果你只记得一个魔术师的命令,那一定是这个。执行%lsmagic命令将显示所有可以使用magic命令的目录:

    Bug:交互调试

    这大概是我最常用的魔术师指令了。

    大多数大数据工程师都遇到过这种情况:实现的代码块不断断裂,你沮丧地写了20个print()语句,试图输出每个自变量的内容。然后,如果你最终修复了这个问题,你必须返回并再次删除所有的print()语句。

    但是没必要这样。遇到难题后,只要实现bug命令,就可以实现你要 *** 作的随机编码部分:

    图中发生了什么?

  • 每个人都有一个函数,以目录为关键字,对所有偶数取平方值。

  • 大家都很努力,但是也有一些问题。但是大家都不知道怎么回事!

    对该函数应用bug命令。

    让程序调试告诉大家x和type(x)的值。

    问题不言而喻:大家都把‘6’作为字符串数组输入到函数里了!

    这对于更复杂的函数非常有效。

    %store:转移笔记本中间的参数

    这个指挥也很帅。假设你已经花了一些时间清理笔记本中的数据信息,现在你想在另一个笔记本中测试一些功能。是在同一个笔记本上完成功能,还是把数据信息存储起来,加载到另一个笔记本上?应用%store命令后,这种实际 *** 作是不必要的!这个命令将存储自变量,这可以在其他随机笔记本中找到:

  • %store[variable]存储参数。

  • %store-r[variable]加载/查找存储参数。

    %WHO:枚举所有静态变量。

    你有没有遇到过取了自变量的值后忘记用户标识符的情况?还是不小心删除了假设自变量的值的单元格?使用%who命令,您可以获得所有静态变量的列表:

    %%time:守时法术命令

    这个命令可以用来获得所有的计时信息。只需对任意可执行代码使用%%time命令,就可以得到以下输出:

    %%WriteFile:将单元格内容加载到文档中

    当你在notebook中编写复杂的函数或类,并希望将它们存储在一个独占文档中时,这个拼写命令非常有效。您只能将%%writefile前缀和要保存的文件夹的名称添加到函数或类的单元格中:

    如上图,我们可以将建立的函数存储在utils.py文档中,然后就可以随便导入了。也可以在其他笔记本中完成,只要和utils.py文档属于同一个文件目录。

    4。Jupyter中的文件格式编辑

    这个专用工具很帅!Jupyter在markdown中充分考虑了HTML/CSS文件格式。以下是我最常用的功能:

    深蓝色,流行趋势:

    <div class="alert alert-block alert-info">   This is <b>fancy</b>!</div>

    鲜红色,轻度恐慌:

    <div class="alert alert-block alert-danger"> This is <b>baaaaad</b>!</div>

    绿色安静:

    <div class="alert alert-block alert-success"> This is <b>gooood</b>!</div>

    下图显示了它们 *** 作的整个过程:

    如果你想展示一些对于笔记本文件格式的发现,这个非常有效!

    5。Jupyter键盘快捷键

    掌握和学习训练快捷键,可以使用命令控制面板:CtrlShiftP获取笔记本所有功能的目录。下面选择了几个基本命令:

  • Esc:进入命令模式。在命令模式下,您可以使用键盘按键启动笔记本中的导航栏。

  • 在命令模式下:

  • a和b:在当前单元格的上方或下方插入一个新单元格。

  • M:当前单元格变为Markdown。

    Y:细胞去编码的现状。

    D,D:删除当前单元格。

    回车:今天的单元格返回写法。


    在写作方式上:

  • ShiftTab:将文本文档字符串数组(文本文档)显示到您在当前单元格中输入的目标,不断应用键盘快捷键循环应用文本文档模式。

  • CtrlShift-:拆分鼠标光标所属的当前单元格。

    EscF:搜索并更改代码(不包括输出)。

    EscO:转换单元格输出。

    选取几个单元格:

  • 下移和上移:选择正下方或正上方的单元格。

  • ShiftM:将选中的单元格拼在一起。

    注意,选中几个单元格后,可以大量删除/复制/剪切/粘贴/ *** 作。

    6。在Jupyter(或IPython)中使一个模块有几个其他输出

    你想给熊猫看数据框。头()和。tail(),但是您不得不中途放弃,因为构建一个额外的可运行的编码模块太不方便了。尾部()。你经历过那种经历吗?现在不要害怕,您可以使用下面的代码行来显示您想要显示的输出:

    from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"

    下图显示了几个输出的结果:

    7。及时为Jupyter笔记本制作PPT

    有了RISE,只需按一个功能键就能及时把Jupyter笔记本换成ppt。而且笔记本还是活动的,除了ppt演示还可以实现即时编号!

    要应用这个专用工具,只需要根据conda或pip安装RISE即可。

    conda install -c conda-forge rise

    或者

    pip install RISE

    现在,您可以点击“新建”按钮为笔记本制作一个非常好的ppt:

    欢迎分享,转载请注明来源:内存溢出

    原文地址: https://outofmemory.cn/zz/763063.html

    (0)
    打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
    上一篇 2022-05-01
    下一篇 2022-05-01

    发表评论

    登录后才能评论

    评论列表(0条)

    保存