简单说下图形选择啦,通常我们最常用的图形是折线图、扇形图、条形图,它们的伍弊功能简单概括为:
折线图:表示变化情况;
扇形图:表示各类别的分布占比情况;
条形图:表示具体数值;
接下来要说的直方图是以条形图的形式展现的,在统计学中, 直方图 (握空英语:Histogram)是一种对数据分布情况的图形表示。
以下展示了python画直方图的几种方式,这里涉及到了3个包:matplotlib、pandas、seanborn。
1、使用 matplotlib.pyplot.hist 函数(本段橘瞎文主要讲解该方法画直方图)
2、使用 pandas.DataFrame.plot.hist 函数
3、使用 pandas.DataFrame.hist 函数
4、使用 seaborn.distplot 函数
以下为 matplotlib.pyplot.hist 函数介绍:
参数:
返回值:
模拟真实场景:我们通过分析打分,给1000个客户进行了排名,排名越靠前,说明客户越优异,为了找到特定的200个客户的排名处于这1000个客户中的位置,使用了直方图对比的方式。以下使用的数据是为模拟场景,随机出来的结果排名比较靠后,所以这些客户质量并不高:
hist: https://my.oschina.net/u/2474629/blog/1793008
matplotlib中文乱码: https://www.jianshu.com/p/c0f19f87036f
给定一个序列t:hist = {}
for x in t:
hist[x] = hist.get(x,0)+1
得到的结果是耐余一个将值映射到其频数的字典。冲亩指将其除以n即可把频数转换成频率,这称为归一散配化:
n = float(len(t))
pmf = {}
for x, freq in hist.items():
pmf[x] = freq/n
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)