数据清洗是对一些没有用的数据进行清洗的过程。很多的数据集存在数据缺失、数据格式错误、错误的数据或重复数据的情况。我们需要对这些数据进行处理,以确保数据分析的准确性。
数据缺失,对空值的处理分删除和填充
数据删除
isnull()函数判断数据是否为空,空为True,否则为False
指定空值
dropna()函数删除有空值的行
移除指定列字段为空的行
空值的替换填充
数据格式错误处理
错误数据处理
重复数据处理,两个函数
duplicated()函数如果对应的数据是重复的返回True,否则为False
删除重复数据,drop_duplicates()方法
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)