解决方法:使用read_csv方法时,通过names参数设定列名(不小于数据里的最大列数)。
import numpy as np import pandas as pd import glob files = glob.glob(r'*.txt') f = open(files[0], 'r') column_names = [i for i in range(0, 10000)] # 列数不小于实际数据的列数 df = pd.read_csv(files[0], delimiter=' ', names=column_names) # 一定要加入names参数 df = df.drop([df.columns[0], df.columns[1]], axis=1) # 删除第1、2列 data = np.array(df) temp = [] for i in range(np.size(data, 0)): data_temp = data[i, :] data_new_l = np.delete(data_temp, np.isnan(data_temp), 0) temp = pd.concat([pd.Dataframe(temp), pd.Dataframe([data_new_l])], axis=0) data_new = np.array(temp)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)