Python数据可视化之绘制计数图(图文并茂版!!!)

Python数据可视化之绘制计数图(图文并茂版!!!),第1张

概述绘制计数图数据获取计数图的介绍绘制计数图数据处理绘制图像注意总结数据获取       •在上篇博客中我们介绍了绘制抖动的带状图:Python数据可视化之绘制抖动的带状图(图文并茂版!!!)       •并且也介绍了数据的来源获取,及数据分析包含数据特征值的解

绘制计数图数据获取计数图的介绍绘制计数图数据处理绘制图像注意总结

数据获取

       •在上篇博客中我们介绍了绘制抖动的带状图:Python数据可视化之绘制抖动的带状图(图文并茂版!!!)
       •并且也介绍了数据的来源获取,及数据分析包含数据特征值的解读等等!!

计数图的介绍

       •抖动的带状图的作用就是向我们展示哪些位置存在着相同的点,根据抖动的幅度来判断各个相同点的数量的多少,现在我们学习一种和抖动的带状图作用相似的图像,叫做计数图,它是通过某个坐标点的大小(面积)来判断此点相同数量的多少!!!
       •如果你的需求是将某个数据集的某两个特征值作为横纵坐标,并将所有点都展示在图像上, 包括那些横纵坐标相同的点,那么你可以选择抖动的带状图或者计数图,二者皆可以!!!

绘制计数图数据处理

       •在技术图中,坐标点的面积越大,即为该点坐标的相同数量越多,首先我么需要将我们所需的横、纵坐标取出,并统计各个(相同)坐标点的数量
       •横坐标:城市里程/加仑(cty)
       •纵坐标:公路里程/加仑(hwy)
代码测试:

import matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsdf = pd.read_csv(r'D:\mpg_ggplot2.csv')# 数据处理df_counts = df.groupby(['hwy', 'cty']).size().reset_index(name='counts')print(df_counts)

运行显示:


       •代码解读:df.groupby([‘hwy’, ‘cty’]).size() 以hwy,cty作为主键,取出所有不同的类别,size为聚合函数,将相同类别聚合在一起,.reset_index(name=‘counts’) 重新设置索引名称,当括号内的name属性为空时,索引为0,name属性为何值,则索引名称为何值:


绘制图像

       •将数据处理与绘制图像代码整合得:

import matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsdf = pd.read_csv(r'D:\mpg_ggplot2.csv')# 数据处理df_counts = df.groupby(['hwy', 'cty']).size().reset_index(name='counts')# 绘制图像fig, ax = plt.subplots(figsize=(12, 8), dpi=80)sns.stripplot(x=df_counts.cty              , y=df_counts.hwy              , sizes=df_counts.counts * 25  # 使用sizes属性而不是size              , ax=ax              )# 装饰图片plt.rcParams['Font.sans-serif'] = ['Simhei']  # 设置字体为黑体plt.xlabel('城市里程/加仑', Fontsize=16)  # x轴名称plt.ylabel('公路里程/加仑', Fontsize=16)  # y轴名称plt.xticks(Fontsize=12)plt.yticks(Fontsize=12)plt.Title('Counts Plot - Size of circle is bigger as more points overlap', Fontsize=20)plt.show()

图像显示:

注意

       •我们在设置坐标点的大小时,应该使用属性sizes而不是size,如果使用size属性会出现下述报错:


       •解决使用size属性报错的方法参考博客:解决报错:使用seaborn绘制计数图时出现错误:ValueError: s must be a scalar, or the same size as x and y(图文并茂版!!)

总结

       •在使用计数图时,应注意我们上述提到的注意点,如数据处理,sizes的选择等等!!,计数图的作用与抖动的带状图相似,遇到实际问题可自行分析,选择合适的图像进行展示数据!!!

总结

以上是内存溢出为你收集整理的Python数据可视化之绘制计数图(图文并茂版!!!)全部内容,希望文章能够帮你解决Python数据可视化之绘制计数图(图文并茂版!!!)所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1185686.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存