- 欢迎关注公众号【Python开发实战】, 获取更多内容!
- pivot函数
- pivot函数介绍
- 用例1
- 用例2
- 用例3
函数形式为pivot(index=None, columns=None, values=None),返回由给定索引/列组织的重塑Dataframe。根据列值重塑Dataframe的数据,使用指定的索引/列的唯一值来形成结果的Dataframe的轴。但是不支持数据聚合,多个值会导致列中的MultiIndex。
参数解析:
- index:str或object或str的列表(pandas 1.1.0版本之后可以接受列表),用于制作新Dataframe的索引,如果为None,则使用现在的索引。
- columns:str或object或str的列表(pandas 1.1.0版本之后可以接受列表),用于制作新Dataframe的列。
- **values:**str或object或str的列表,用于填充新Dataframe的值,如果未指定,将使用所有剩余的列,并且新Dataframe的列将具有多级索引。
返回:
- 重塑的Dataframe。
引起ValueError:
- 当按指定的index、columns和values取新Dataframe的值时,如果有多个值,会引起ValueError报错。
导入pandas
import pandas as pd
df = pd.DataFrame({
'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
'baz': [1, 2, 3, 4, 5, 6],
'zoo': ['x', 'y', 'z', 'q', 'w', 't']
})
df
输出:
使用foo列的值作为新Dataframe的索引,使用bar列的值作为新Dataframe的列,使用baz列的值作为新Dataframe的值。
df.pivot(index='foo', columns='bar', values='baz')
输出:
使用foo列的值作为新Dataframe的索引,使用bar列的值作为新Dataframe的列,values不指定,会指定剩余所有的列。
df.pivot(index='foo', columns='bar')
输出:
对上面具有多级索引的Dataframe的进行索引取值。
df.pivot(index='foo', columns='bar')['baz']
输出:
用例2df2 = pd.DataFrame({
'lev1': [1, 1, 1, 2, 2, 2],
'lev2': [1, 1, 2, 1, 1, 2],
'lev3': [1, 2, 1, 2, 1, 2],
'lev4': [1, 2, 3, 4, 5, 6],
'values': [0, 1, 2, 3, 4, 5],
})
df2
输出:
index和columns传入列表。(需要pandas版本在1.1.0之后)
df2.pivot(index="lev1", columns=["lev2", "lev3"],values="values")
输出:
df2.pivot(index=['lev1', 'lev2'], columns=['lev3'], values='values')
输出:
用例3df3 = pd.DataFrame({
'foo': ['one', 'one', 'two', 'two'],
'bar': ['A', 'A', 'B', 'C'],
'baz': [1, 2, 3, 4],
})
df3
输出:
如果指定index为foo,columns为bar,则df3的前两行是相同的,会引起ValueError报错。
try:
df3.pivot(index='foo', columns='bar', values='baz')
except ValueError as e:
print(e)
输出:
Index contains duplicate entries, cannot reshape
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)