这两天处理数据学到了一些,也踩到一些基础坑,记下来也分享一下。
1. 手工转写Javascript为Python,出现对 for 循环和 do while 循环理解不到位,然后产生空循环的问题。以后可以选用笨一点但稳妥的办法来转写。
2. 对Dataframe格式的日期时间,可以在读取的时候就指定parse_dates=['col']
df = pd.read_csv('E:/DATA/ready.csv', parse_dates=["DATETIME"])
3. NaN格式的数据,和Null、false还是有差别的。判断空值的时候用相应的空值,比如全部用np.nan
if np.nan in [a1, a2, a3, a4, a5]: a = np.nan
4. 用好debug功能
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)