import pandas as pd data = pd.read_csv("C:/Users/ASUS/Desktop/第四章 类别比较型图表数据/PloarRange_Data.csv")
data.info() #探索数据
使用sklearn中的SimleImputer进行缺失值处理,sklearn提供中位数,0,众数进行填充
首先对填充方法进行实列化from sklearn.impute import SimpleImputer #导入缺失值处理库 imp_mean = SimpleImputer() #实列化,默认使用均值填充 imp_median = SimpleImputer(strategy = "median") #使用中位数进行填 imp_0 = SimpleImputer(strategy = "constant",fill_value=0) #使用0进行填充 imp_most = SimpleImputer(strategy="most_frequent") #使用众数进行填充对不同的方法进行训练
imp_mean = imp_mean.fit_transform(data1.values.reshape(1,-1)) imp_median = imp_median.fit_transform(data1.values.reshape(1,-1)) imp_0 = imp_0.fit_transform(data1.values.reshape(1,-1)) imp_most = imp_most.fit_transform(data1.values.reshape(1,-1))(注:sklearn中默认不支持一维数据输入,当数据为一维时需要使用reshape(1,-1)进行维度增加) 缺失值填充后数据
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)