我有一个非常大且稀疏的垃圾邮件Twitter帐户数据集,它要求我缩放x轴,以便能够可视化各种变量的分布(直方图,kde等)和cdf(tweets_count,关注者数量/关注等等).
> describe(spammers_class1$tweets_count) var n mean sd median trimmed mad min max range skew kurtosis se1 1 1076817 443.47 3729.05 35 57.29 43 0 669873 669873 53.23 5974.73 3.59
在此数据集中,值0具有非常重要性(实际上0应具有最高密度).但是,使用对数标度,这些值将被忽略.例如,我想将值更改为0.1,但是有垃圾邮件帐户有10 ^ -1个关注者是没有意义的.
那么,python和matplotlib中的解决方法是什么?
解决方法 为每个x值添加1,然后记录日志:import matplotlib.pyplot as pltimport numpy as npimport matplotlib.ticker as tickerfig,ax = plt.subplots()x = [0,10,100,1000]y = [100,20,50]x = np.asarray(x) + 1 y = np.asarray(y)ax.plot(x,y)ax.set_xscale('log')ax.set_xlim(x.min(),x.max())ax.xaxis.set_major_formatter(ticker.FuncFormatter(lambda x,pos: '{0:g}'.format(x-1)))ax.xaxis.set_major_locator(ticker.FixedLocator(x))plt.show()
使用
ax.xaxis.set_major_formatter(ticker.FuncFormatter(lambda x,pos: '{0:g}'.format(x-1)))ax.xaxis.set_major_locator(ticker.FixedLocator(x))
根据x的非对数值重新标记刻度线.
(我最初的建议是使用plt.xticks(x,x-1),但这会影响所有轴.为了将更改隔离到一个特定轴,我将所有命令调用更改为ax,而不是调用plt.)
matplotlib删除包含NaN,inf或-inf值的点.由于log(0)是-inf,因此将从对数图中移除对应于x = 0的点.
如果将所有x值增加1,因为log(1)= 0,对应于x = 0的点将不会在对数图上的x = log(1)= 0处绘制.
剩余的x值也将被移动一个,但是对于眼睛来说无关紧要,因为对于大的x值,log(x 1)非常接近log(x).
总结以上是内存溢出为你收集整理的python – 具有零值的Matplotlib对数标度全部内容,希望文章能够帮你解决python – 具有零值的Matplotlib对数标度所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)