数据

数据,第1张

数据

#Tidy Data
from __future__ import division
from collections import defaultdict
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
import akshare as ak
from bubbly.bubbly import bubbleplot 
from plotly.offline import init_notebook_mode, iplot
# init_notebook_mode()

基本配置

sns.set(color_codes=True)

数据加载

df=pd.read_csv(r'E:ADownLoadtrain_public.csv')
print(df.info())

数据处理

data_array = np.array(df['total_loan']) #单列
data_list = data_array.tolist()
d02 = [float('{:.2f}'.format(i)) for i in data_list]

可视化
数据Tidy Data格式,用Seaborn library,Pandas和bubbly作辅助
XXX[“XXX”].value_counts()

bubbly:
最多可7个维度

figure = bubbleplot()
iplot(figure, config={'scrollzoom': True})

散点图:

sns.FacetGrid()

Jointplot:

sns.jointplot(,kind="reg")

直方图:

g = sns.FacetGrid(iris, col="Species")
g = g.map(plt.hist, "SepalWidthCm", bins=20)

KDE:
Pairplot:
箱线图:
jitter=True避免点重合
小提琴图:
核密度图:
Andrews curves:
Radviz:
特征间相关系数热力图:
数值是皮尔森相关系数

tips:
散点图 (Scatterplot)
直方图 (Histogram)
小提琴图 (Violinplot)
特征两两对比图(Pairplot)
安德鲁斯曲线 (Andrews curves)
核密度图 (Kernel density estimation plot)
平行坐标图 (Parallel coordinates)
Radviz (力矩图?)
热力图 (Heatmap)
气泡图 (Bubbleplot)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5658984.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存