数据分析第一章

数据分析第一章,第1张

pandas应用

pandas的主要数Series(一维数组)与DataFrame(二维数组),这两种数据结构可以处理金融、统计、社会科学、工程等。

数据结构

Series是一种类似于一维数组的对象,它是由一组数据及其相关的数据标签组成。

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值的类型(数值,字符串,布尔型)。DataFrame既有行索引也有列索引,它可以看作是由Series组成的字典。

pandas Series

pandas.Series(data,index,dtype,name,copy)
import pandas as pd
courses=['chinese','math','english','computer']
data=pd.Series(data=courses)
print(data)

运行结果如下:

   

pandas DataFrame

pandas.DataFrame(data,index,columns,dtype,copy)

创建一个DataFrame

import pandas as pd
df=pd.DataFrame(
    {
        '姓名':['小张','小王','小李','小明'],
        '性别':['男','女','女','男'],
        '年龄':['21','19','20','20']

    }
)
print(df)

运行结果如下:

 Series转换成DataFrame

import pandas as pd
grades={'chinese':80,'math':90,'english':75,'computer':90}
data=pd.Series (data=grades)
df=pd.DataFrame(data,columns=['grade'])
print(df)

运行结果如下:

Series转换成DataFrame

import pandas as pd
grades={'chinese':80,'math':90,'english':75,'computer':90}
data=pd.Series(data=grades)
df=data.reset_index()
df.columns=['course','grade']
print(df)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/793353.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-06
下一篇 2022-05-06

发表评论

登录后才能评论

评论列表(0条)

保存