读取提供的文件students.csv中的数据,利用Dataframe进行如下 *** 作:
(1)读取数据,创建Dataframe,将sno作为索引;
import pandas as pd
import openpyxl
dfs=pd.read_csv(r'C:UsersAdministratorDesktopstudents.csv',encoding='gb18030',index_col='sno')
(2)查询“刘欣”的age和score;
q1=dfs.loc[dfs.name=='刘欣'][['name','age','score']]
print(q1)
- 查询所有age小于20岁的女同学(sex=‘F’)的信息;
q2=dfs.loc[(dfs['age']<20) & (dfs['sex']=='F')]
q21=dfs.query("(sex=='F') and (age<20)")
print(q2)
print(q21)
- 按area统计各地区的学生人数,要求按人数的降序排;
q3=dfs.groupby("area").name.count().sort_values(ascending=False)
print(q3)
(5)增加一列mark,如果score>=480,则标记为A,其他标记为B;
dfs['mark']='B'
dfs.loc[dfs['score']>=480,'mark']='A'
- 将修改后的数据保存为excel文件,文件名为stu.xlsx。
import pandas as pd
import openpyxl
dfs=pd.read_csv(r'C:UsersAdministratorDesktopstudents.csv',encoding='gb18030',index_col='sno')
print(dfs)
dfs.to_excel('C:\Users\Administrator\Desktop\tu.xlsx')
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)