如何从pandas multiindex获取随机(bootstrap)示例_python

概述我正在尝试从Pandas中的多索引数据框创建一个自举样本.下面是一些生成我需要的数据的代码.from itertools import product import pandas as pd import numpy as np df = pd.DataFrame({'group1': [1, 1, 1, 2, 2, 3],

我正在尝试从Pandas中的多索引数据框创建一个自举样本.下面是一些生成我需要的数据的代码.

from itertools import productimport pandas as pdimport numpy as npdf = pd.DataFrame({'group1': [1,1,2,3],'group2': [13,18,20,77,109,123],'value1': [1.1,3,4,5,6],'value2': [7.1,8,9,10,11,12]                       })df = df.set_index(['group1','group2'])print df

df数据框如下所示：

                   value1  value2group1 group2                1      13         1.1     7.1       18         2.0     8.0       20         3.0     9.02      77         4.0    10.0       109        5.0    11.03      123        6.0    12.0

我想从第一个索引中获取一个随机样本.例如,假设随机值np.random.randint(3,size = 3)产生[3,2].我希望结果数据框看起来像：

                   value1  value2group1 group2                3      123        6.0    12.02      77         4.0    10.0       109        5.0    11.02      77         4.0    10.0       109        5.0    11.0

我花了很多时间研究这个,我一直无法找到一个类似的例子,其中多索引值是整数,二级索引是可变长度,主索引样本是重复的.这就是我认为引导的适当实现可行的方式.最佳答案尝试：

df.unstack().sample(3,replace=True).stack()

总结

以上是内存溢出为你收集整理的如何从pandas multiindex获取随机(bootstrap)示例全部内容，希望文章能够帮你解决如何从pandas multiindex获取随机(bootstrap)示例所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1206357.html

如何从pandas multiindex获取随机(bootstrap)示例

发表评论

评论列表（0条）