Pandas中数据框的子集的随机样本

Pandas中数据框的子集的随机样本,第1张

Pandas中数据框的子集的随机样本

一种解决方案是使用

choice
numpy中的函数。

假设您要100个条目中有50个条目,可以使用:

import numpy as npchosen_idx = np.random.choice(1000, replace=False, size=50)df_trimmed = df.iloc[chosen_idx]

当然,这不考虑您的块结构。

i
例如,如果要从块中抽取50个项目的样本,可以执行以下 *** 作:

import numpy as npblock_start_idx = 1000 * ichosen_idx = np.random.choice(1000, replace=False, size=50)df_trimmed_from_block_i = df.iloc[block_start_idx + chosen_idx]


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5650076.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存