Pandas

Pandas,第1张

Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图 *** 作。Pandas 之所以能够实现了数据可视化,主要利用了 Matplotlib 库的 plot() 方法,它对 plot() 方法做了简单的封装,因此您可以直接调用该接口。

绘图方式,如下所示:

  • 线形图: 默认
  • 柱状图:bar() 或 barh()
  • 直方图:hist()
  • 箱状箱:box()
  • 区域图:area()
  • 散点图:scatter()

通过关键字参数kind可以把上述方法传递给 plot()。

线形图

下面看一组简单的示例:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#创建包含时间序列的数据
df = pd.DataFrame(np.random.randn(8,4),index=pd.date_range('2/1/2020',periods=8), columns=list('ABCD'))
df.plot()
plt.show()

输结果图,如下所示:

如上图所示,如果行索引中包含日期,Pandas 会自动调用 gct().autofmt_xdate() 来格式化 x 轴。

柱状图

创建一个柱状图,如下所示:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(10,),columns=['a','b','c','d','e'])
#或使用df.plot(kind="bar")
df.plot.bar()
plt.show()

输出结果:

柱状堆叠图:通过设置参数stacked=True可以生成柱状堆叠图,示例如下:

df.plot(kind="bar",stacked=True)
#或者使用df.plot.bar(stacked="True")
plt.show()

输出结果:

水平柱状图:如果要绘制水平柱状图,您可以使用以下方法:

df.plot.barh(stacked=True)
plt.show()

输出结果:

直方图

 plot.hist() 可以实现绘制直方图,并且它还可以指定 bins(构成直方图的箱数)。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame({'A':np.random.randn(100)+2,'B':np.random.randn(100),'C':
np.random.randn(100)-2,'D':np.random.randn(100)+3}, columns=['A', 'B', 'C', 'D'])
#指定箱数为15
df.plot.hist(bins=15)
plt.show()

输出结果:

 给每一列数据都绘制一个直方图,需要使以下方法:

  1. #使用diff绘制
  2. df.diff().hist(color="r",alpha=0.5,bins=15)

输出结果:

箱型图

通过调用 Series.box.plot() 、DataFrame.box.plot() 或者 DataFrame.boxplot() 方法来绘制箱型图,它将每一列数据的分布情况,以可视化的图像展现出来。

import pandas as pd
import numpy as np
from matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(10, 4), columns=['A', 'B', 'C', 'D'])
df.plot.box()
plt.show()

输出结果:

区域图

可以使用 Series.plot.area() 或 DataFrame.plot.area() 方法来绘制区域图。

import pandas as pd
import numpy as np
from matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(5, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
plt.show()

输出结果:

散点图

使用 DataFrame.plot.scatter() 方法来绘制散点图,如下所示:

import pandas as pd
import numpy as np
from matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(30, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a',y='b')
plt.show()

输出结果:

饼状图

饼状图可以通过 DataFrame.plot.pie() 方法来绘制。示例如下:

import pandas as pd
import numpy as np
from matplotlib.pyplot as plt
df = pd.DataFrame(3 * np.random.rand(4), index=['go', 'java', 'c++', 'c'], columns=['L'])
df.plot.pie(subplots=True)
plt.show()

输出结果:

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/798944.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-06
下一篇 2022-05-06

发表评论

登录后才能评论

评论列表(0条)

保存