pd.concat。希望它应该比外部合并更快,更有效地利用内存。
df_list = [df1, df2, ...]for df in df_list: df.set_index(['name', 'id'], inplace=True)df = pd.concat(df_list, axis=1) # join='inner'df.reset_index(inplace=True)
或者,您可以用
concat迭代代替(第二步)
join:
from functools import reducedf = reduce(lambda x, y: x.join(y), df_list)
这可能会更好,也可能不会更好
merge。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)