我猜你和@jezrael误解了熊猫文档中的一个例子:
df.set_index(['A', 'B'])
A并且
B在此示例中为列名/标签:
In [55]: df = pd.Dataframe(np.random.randint(0, 10, (5,4)), columns=list('ABCD'))In [56]: dfOut[56]: A B C D0 6 9 7 41 5 1 3 42 4 4 0 53 9 0 9 84 6 4 5 7In [57]: df.set_index(['A','B'])Out[57]: C DA B6 9 7 45 1 3 44 4 0 59 0 9 86 4 5 7
该文件说,它应该是 _ 列表 的列标签/的
阵列_ 。
所以您正在寻找:
In [58]: df.set_index([['A','B','C','D','E']])Out[58]: A B C DA 6 9 7 4B 5 1 3 4C 4 4 0 5D 9 0 9 8E 6 4 5 7
但正如@jezrael所建议的那样,
df.index = ['A','B',...]是一种更快,更惯用的方法…
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)