python pandas部分应用记录_随笔

python pandas部分应用记录

读取提供的文件students.csv中的数据，利用Dataframe进行如下 *** 作：

（1）读取数据，创建Dataframe，将sno作为索引；

import pandas as pd

import openpyxl

dfs=pd.read_csv(r'C:UsersAdministratorDesktopstudents.csv',encoding='gb18030',index_col='sno')

（2）查询“刘欣”的age和score；

q1=dfs.loc[dfs.name=='刘欣'][['name','age','score']]

print(q1)

q2=dfs.loc[(dfs['age']<20) & (dfs['sex']=='F')]

q21=dfs.query("(sex=='F') and (age<20)")

print(q2)

print(q21)

q3=dfs.groupby("area").name.count().sort_values(ascending=False)

print(q3)

（5）增加一列mark，如果score>=480，则标记为A，其他标记为B；

dfs['mark']='B'

dfs.loc[dfs['score']>=480,'mark']='A'

import pandas as pd

import openpyxl

dfs=pd.read_csv(r'C:UsersAdministratorDesktopstudents.csv',encoding='gb18030',index_col='sno')

print(dfs)

dfs.to_excel('C:\Users\Administrator\Desktop\tu.xlsx')

欢迎分享，转载请注明来源：内存溢出

python pandas部分应用记录