Educoder Basemap和Seaborn 第一关:Seaborn

Educoder Basemap和Seaborn 第一关:Seaborn,第1张

Educoder Basemap和Seaborn 第一关:Seaborn

第一关:Seaborn

任务描述

本关任务:编写一个绘制每个月销售总额的折线图。

相关知识

为了完成本关任务,你需要掌握:1.matplotlib的缺点,2.如何使用seaborn进行可视化,并设置整体布局风格。

  • 适用场景: 折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。它还适合多个二维数据集的比较。

用Seaborn做可视化

即使matplotlib已经如此强大了,但是不得不承认它不支持的功能还有很多。总结如下:

  • 2.0之前的版本的默认配置样式绝对不是用户的最佳选择;

  • matplotlib的API比较底层。虽然可以实现复杂的统计数据可视化,但是通常都需要写大量的样板代码;

  • matplotlib不支持Pandas的Dataframe数据的可视化,必须先提取每个Series。

对于这些问题的终结者就是seaborn。Seaborn 在 Matplotlib 的基础上开发了一套 API,为默认的图形样式和颜色设置提供了理智的选择,为常用的统计图形定义了许多简单的高级函数,并与 Pandas Dataframe 的功能有机结合。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图。

而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与Pandas数据结构以及scipy与statsmodels等统计模式。

Seaborn与Matplotlib

下面用 Matplotlib 的经典图形样式和配色方案画一个简易的随机游走图。

 
  1. import matplotlib.pyplot as plt
  2. plt.style.use('classic')
  3. import numpy as np
  4. import pandas as pd
  5. rng = np.random.RandomState(0)
  6. x = np.linspace(0, 10, 500)
  7. y = np.cumsum(rng.randn(500, 6), 0)
  8. plt.plot(x, y)
  9. plt.legend('ABCDEF', ncol=2, loc='upper left')
  10. plt.show()

在看看使用seaborn来实现。我们会发现,Seaborn不仅有许多高级的画图功能,而且可以改写matplotlib的默认参数,从而用简单的matplotlib脚本获得更好的效果。可以用Seaborn的set()方法设置样式。

 
  1. import seaborn as sns
  2. sns.set()
  3. plt.plot(x, y)
  4. plt.legend('ABCDEF', ncol=2, loc='upper left')
  5. plt.savefig("T2.png")
  6. plt.show()

上面应用了seaborn的默认样式。seaborn有5个seaborn的主题,适用于不同的应用和人群偏好:

  • darkgrid黑色网格(默认);

  • whitegrid白色网格;

  • dark黑色背景;

  • white白色背景;

  • ticks应该是四周都有刻度线的白背景。

编程要求

本关的编程任务是补全右侧上部代码编辑区内的相应代码,根据输入文件路径读取文件,统计各个月销售总和,然后绘制折线图,需要应用seaborn设置默认样式,具体可视化要求如下:

  • 折线图的figsize为(10, 10);

  • 文件名为Task1/img/T1.png;

  • 具体要求请参见后续测试样例。

文件的部分数据如下:

提示:在绘制折线图时,需要对数据进行预处理,通过支付时间提取月份信息,再根据月份信息进行聚类,汇总每个月的实际金额,得到月销售总和。

请先仔细阅读右侧上部代码编辑区内给出的代码框架,再开始你的编程工作!

测试说明

平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。

测试输入:

无测试输入

预期输出: 生成图片与预期图片一致


开始你的任务吧,祝你成功!

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
def student(input_data):
    # ********* Begin *********#
    sns.set()
    plt.figure(figsize=(10,10))
    a=pd.read_csv(input_data)
    a["month"]=a["支付时间"].map(lambda x:int(x.split("/")[1]))
    d=a["实际金额"].groupby(a["month"]).sum()
    d=d.sort_index(ascending=False)
    plt.plot(d)
    plt.savefig("Task1/img/T1.png")
    plt.show()
    # ********* End *********#

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5443559.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-11
下一篇 2022-12-11

发表评论

登录后才能评论

评论列表(0条)

保存