一种解决方案是使用
choicenumpy中的函数。
假设您要100个条目中有50个条目,可以使用:
import numpy as npchosen_idx = np.random.choice(1000, replace=False, size=50)df_trimmed = df.iloc[chosen_idx]
当然,这不考虑您的块结构。
i例如,如果要从块中抽取50个项目的样本,可以执行以下 *** 作:
import numpy as npblock_start_idx = 1000 * ichosen_idx = np.random.choice(1000, replace=False, size=50)df_trimmed_from_block_i = df.iloc[block_start_idx + chosen_idx]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)