pandas应用
pandas的主要数Series(一维数组)与DataFrame(二维数组),这两种数据结构可以处理金融、统计、社会科学、工程等。
数据结构
Series是一种类似于一维数组的对象,它是由一组数据及其相关的数据标签组成。
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值的类型(数值,字符串,布尔型)。DataFrame既有行索引也有列索引,它可以看作是由Series组成的字典。
pandas Series
pandas.Series(data,index,dtype,name,copy)
import pandas as pd
courses=['chinese','math','english','computer']
data=pd.Series(data=courses)
print(data)
运行结果如下:
pandas DataFrame
pandas.DataFrame(data,index,columns,dtype,copy)
创建一个DataFrame
import pandas as pd
df=pd.DataFrame(
{
'姓名':['小张','小王','小李','小明'],
'性别':['男','女','女','男'],
'年龄':['21','19','20','20']
}
)
print(df)
运行结果如下:
Series转换成DataFrame
import pandas as pd
grades={'chinese':80,'math':90,'english':75,'computer':90}
data=pd.Series (data=grades)
df=pd.DataFrame(data,columns=['grade'])
print(df)
运行结果如下:
Series转换成DataFrame
import pandas as pd
grades={'chinese':80,'math':90,'english':75,'computer':90}
data=pd.Series(data=grades)
df=data.reset_index()
df.columns=['course','grade']
print(df)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)