第一关:Seaborn
任务描述
本关任务:编写一个绘制每个月销售总额的折线图。
相关知识
为了完成本关任务,你需要掌握:1.matplotlib的缺点,2.如何使用seaborn进行可视化,并设置整体布局风格。
- 适用场景: 折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。它还适合多个二维数据集的比较。
用Seaborn做可视化
即使matplotlib已经如此强大了,但是不得不承认它不支持的功能还有很多。总结如下:
-
matplotlib的API比较底层。虽然可以实现复杂的统计数据可视化,但是通常都需要写大量的样板代码;
-
matplotlib不支持Pandas的Dataframe数据的可视化,必须先提取每个Series。
对于这些问题的终结者就是seaborn。Seaborn 在 Matplotlib 的基础上开发了一套 API,为默认的图形样式和颜色设置提供了理智的选择,为常用的统计图形定义了许多简单的高级函数,并与 Pandas Dataframe 的功能有机结合。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图。
而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与Pandas数据结构以及scipy与statsmodels等统计模式。
Seaborn与Matplotlib
下面用 Matplotlib 的经典图形样式和配色方案画一个简易的随机游走图。
- import matplotlib.pyplot as plt
- plt.style.use('classic')
- import numpy as np
- import pandas as pd
- rng = np.random.RandomState(0)
- x = np.linspace(0, 10, 500)
- y = np.cumsum(rng.randn(500, 6), 0)
- plt.plot(x, y)
- plt.legend('ABCDEF', ncol=2, loc='upper left')
- plt.show()
在看看使用seaborn来实现。我们会发现,Seaborn不仅有许多高级的画图功能,而且可以改写matplotlib的默认参数,从而用简单的matplotlib脚本获得更好的效果。可以用Seaborn的set()方法设置样式。
- import seaborn as sns
- sns.set()
- plt.plot(x, y)
- plt.legend('ABCDEF', ncol=2, loc='upper left')
- plt.savefig("T2.png")
- plt.show()
上面应用了seaborn的默认样式。seaborn有5个seaborn的主题,适用于不同的应用和人群偏好:
-
darkgrid黑色网格(默认);
-
whitegrid白色网格;
-
dark黑色背景;
-
white白色背景;
-
ticks应该是四周都有刻度线的白背景。
编程要求
本关的编程任务是补全右侧上部代码编辑区内的相应代码,根据输入文件路径读取文件,统计各个月销售总和,然后绘制折线图,需要应用seaborn设置默认样式,具体可视化要求如下:
-
折线图的figsize为(10, 10);
-
文件名为Task1/img/T1.png;
-
具体要求请参见后续测试样例。
文件的部分数据如下:
提示:在绘制折线图时,需要对数据进行预处理,通过支付时间提取月份信息,再根据月份信息进行聚类,汇总每个月的实际金额,得到月销售总和。
请先仔细阅读右侧上部代码编辑区内给出的代码框架,再开始你的编程工作!
测试说明
平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。
测试输入:
无测试输入
预期输出: 生成图片与预期图片一致
开始你的任务吧,祝你成功!
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd import numpy as np def student(input_data): # ********* Begin *********# sns.set() plt.figure(figsize=(10,10)) a=pd.read_csv(input_data) a["month"]=a["支付时间"].map(lambda x:int(x.split("/")[1])) d=a["实际金额"].groupby(a["month"]).sum() d=d.sort_index(ascending=False) plt.plot(d) plt.savefig("Task1/img/T1.png") plt.show() # ********* End *********#
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)