包
#Tidy Data from __future__ import division from collections import defaultdict import numpy as np import pandas as pd import seaborn as sns import matplotlib as mpl import matplotlib.pyplot as plt import akshare as ak from bubbly.bubbly import bubbleplot from plotly.offline import init_notebook_mode, iplot # init_notebook_mode()
基本配置
sns.set(color_codes=True)
数据加载
df=pd.read_csv(r'E:ADownLoadtrain_public.csv') print(df.info())
数据处理
data_array = np.array(df['total_loan']) #单列 data_list = data_array.tolist() d02 = [float('{:.2f}'.format(i)) for i in data_list]
可视化
数据Tidy Data格式,用Seaborn library,Pandas和bubbly作辅助
XXX[“XXX”].value_counts()
bubbly:
最多可7个维度
figure = bubbleplot() iplot(figure, config={'scrollzoom': True})
散点图:
sns.FacetGrid()
Jointplot:
sns.jointplot(,kind="reg")
直方图:
g = sns.FacetGrid(iris, col="Species") g = g.map(plt.hist, "SepalWidthCm", bins=20)
KDE:
Pairplot:
箱线图:
jitter=True避免点重合
小提琴图:
核密度图:
Andrews curves:
Radviz:
特征间相关系数热力图:
数值是皮尔森相关系数
tips:
散点图 (Scatterplot)
直方图 (Histogram)
小提琴图 (Violinplot)
特征两两对比图(Pairplot)
安德鲁斯曲线 (Andrews curves)
核密度图 (Kernel density estimation plot)
平行坐标图 (Parallel coordinates)
Radviz (力矩图?)
热力图 (Heatmap)
气泡图 (Bubbleplot)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)