我正在尝试从Pandas中的多索引数据框创建一个自举样本.下面是一些生成我需要的数据的代码.
from itertools import productimport pandas as pdimport numpy as npdf = pd.DataFrame({'group1': [1,1,2,3],'group2': [13,18,20,77,109,123],'value1': [1.1,3,4,5,6],'value2': [7.1,8,9,10,11,12] })df = df.set_index(['group1','group2'])print df
df数据框如下所示:
value1 value2group1 group2 1 13 1.1 7.1 18 2.0 8.0 20 3.0 9.02 77 4.0 10.0 109 5.0 11.03 123 6.0 12.0
我想从第一个索引中获取一个随机样本.例如,假设随机值np.random.randint(3,size = 3)产生[3,2].我希望结果数据框看起来像:
value1 value2group1 group2 3 123 6.0 12.02 77 4.0 10.0 109 5.0 11.02 77 4.0 10.0 109 5.0 11.0
我花了很多时间研究这个,我一直无法找到一个类似的例子,其中多索引值是整数,二级索引是可变长度,主索引样本是重复的.这就是我认为引导的适当实现可行的方式.最佳答案尝试:
df.unstack().sample(3,replace=True).stack()
总结 以上是内存溢出为你收集整理的如何从pandas multiindex获取随机(bootstrap)示例全部内容,希望文章能够帮你解决如何从pandas multiindex获取随机(bootstrap)示例所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)