Python数据可视化

Python数据可视化,第1张

3.10.1  脊线图及应用场景

1.脊线图简介

脊线图是部分重叠的线形图,用以在二维空间产生山脉的印象,其中每一行对应的是一个类别,而x轴对应的是数值的范围,波峰的高度代表出现的次数。

2.应用场景

适用于可视化指标数据随时间或空间分布的变化。例如,为了分析不同食品类型与二氧化碳排放量的关系,我们可以使用R语言绘制两者之间的脊线图,如图3-27所示。

图3-27 食物类型与二氧化碳排放量

3.10.2  Python案例实战

为了深入研究该企业在2019年每个月份的商品退单量情况,我们使用每日退单量数据表(return_days.csv),该表包含退单日期(date)和退单量(return)两个字段,然后利用Altair库绘制每月商品退单量的脊线图,其中横轴是退单量,纵轴是退单所在的月份,山峰的高低表示退单的次数,代码如下:

#导入相应库

import altair as alt

import pandas as pd

#连接退单数据

source = pd.read_csv('D:/Python数据可视化分析与案例实战/ch03/return_days.csv',',')

step = 25

overlap = 1

#配置图形参数

alt.Chart(source, height=step).transform_timeunit(Month='month(date)'

).transform_joinaggregate(mean_temp='mean(return)', groupby=['Month']

).transform_bin(['bin_max', 'bin_min'], 'return'

).transform_aggregate(value='count()',groupby=['Month','mean_temp','bin_min','bin_max']

).transform_impute(impute='value',groupby=['Month','mean_temp'],key='bin_min',value=0

).mark_area(interpolate='monotone',fillOpacity=0.8,stroke='lightgray',strokeWidth=0.3

).encode(

    alt.X('bin_min:Q',bin='binned',title='退单量'),

    alt.Y('value:Q',scale=alt.Scale(range=[step, -step * overlap]),axis=None),

    alt.Fill('mean_temp:Q',legend=None,scale=alt.Scale(domain=[30, 5],scheme='redyellowblue')

    )

).facet(

    row=alt.Row('Month:T',title=None,header=alt.Header(labelAngle=0, labelAlign='right', format='%B')

    )

).properties(title='退单量分析',bounds='flush'

).configure_facet(spacing=0

).configure_view(stroke=None

).configure_title(anchor='end')

在Jupyter lab中运行上述代码,生成如图3-28所示的脊线图,从图形可以看出:在2019年,商品的退单量呈现先上升后下降的趋势,在7月份达到峰值,下半年退单量下降较快。

图3-28  脊线图

 

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/922799.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-16
下一篇 2022-05-16

发表评论

登录后才能评论

评论列表(0条)

保存