特征工程—sklearn中缺失值填充方法

特征工程—sklearn中缺失值填充方法,第1张

特征工程—sklearn中缺失填充方法
import pandas as pd
data = pd.read_csv("C:/Users/ASUS/Desktop/第四章 类别比较型图表数据/PloarRange_Data.csv")

data.info()   #探索数据

使用sklearn中的SimleImputer进行缺失值处理,sklearn提供中位数,0,众数进行填充

首先对填充方法进行实列化
from sklearn.impute import SimpleImputer  #导入缺失值处理库
imp_mean = SimpleImputer()                               #实列化,默认使用均值填充
imp_median = SimpleImputer(strategy = "median")    #使用中位数进行填
imp_0 = SimpleImputer(strategy = "constant",fill_value=0) #使用0进行填充
imp_most = SimpleImputer(strategy="most_frequent")   #使用众数进行填充
对不同的方法进行训练
imp_mean = imp_mean.fit_transform(data1.values.reshape(1,-1))
imp_median = imp_median.fit_transform(data1.values.reshape(1,-1))
imp_0  = imp_0.fit_transform(data1.values.reshape(1,-1))
imp_most = imp_most.fit_transform(data1.values.reshape(1,-1))
(注:sklearn中默认不支持一维数据输入,当数据为一维时需要使用reshape(1,-1)进行维度增加) 缺失值填充后数据

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5670185.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存