Python数据分析-使用Pandas从文件中读取数据,并完成相关排序、统计和检索 *** 作

Python数据分析-使用Pandas从文件中读取数据,并完成相关排序、统计和检索 *** 作,第1张

Python数据分析-使用Pandas从文件中读取数据,并完成相关排序、统计和检索 *** 作 相关知识

为了完成本关任务,你需要掌握:1.排序,2.统计。

排序

将数据框架df按特定列排序:

 
  1. df.sort_values(by='##',axis=0,ascending=True, inplace=False, na_position='last')

参数说明 by:指定列名(axis=0或’index’)或索引值(axis=1或’columns’) axis:若axis=0或’index’,则按照指定列中数据大小排序;若axis=1或’columns’,则按照指定索引中数据大小排序,默认axis=0 ascending:是否按指定列的数组升序排列,默认为True,即升序排列 inplace:是否用排序后的数据集替换原来的数据,默认为False,即不替换 na_position:{‘first’,‘last’},设定缺失值的显示位置

统计

基本统计方法:

 
  1. sum() 求和 diff() 差分
  2. max() 最大值 min() 最小值
  3. var() 方差 std() 标准差
  4. median() 中位数 mean() 均值
  5. describe()计算各列的频率、均值、标准差、级值、四分位数
编程要求

根据提示,在右侧编辑器补充代码,完成指定 *** 作。

# -*- coding: utf-8 -*-
"""
Created on Tue Feb  9 20:49:01 2021

@author: Administrator
"""

import pandas as pd

# 1.将scores.xls文件读到名为df的dataframe中
############begin############
df=pd.read_excel('scores.xls')
#############end#############

#2.添加综合分列:考勤20%实验 *** 作20%实验报告60%
############begin############
col_name=df.columns.tolist()
col_name.append('综合分')
df=df.reindex(columns=col_name)
for i in range(len(df)):
    df.iloc[i,9]=0.2*(df.iloc[i,6])+0.2*(df.iloc[i,7])+0.6*(df.iloc[i,8])
#############end#############

#3.按综合分降序和学号升序排序
############begin############
rf=df.sort_values(by=['综合分','学号'],axis=0,ascending=[False,True], inplace=False, na_position='last')

#############end#############

#4.输出综合分最高的同学的姓名和学号(可能有多位同学)
############begin############
sm=rf.iloc[0,9]
a=0
sc=0
while True:
    a+=1
    try:
        if rf.iloc[a,9]==sm:
            sc+=1
    except:
        break
    finally:
        li=[0]
for i in range(1,sc+1):
    li+=[i]
print(rf.iloc[li,[1,0]])
#############end#############

#5.输出性别为“男”而且实验报告>90的同学的姓名和综合分信息
############begin############
lab_sco=[]
for j in range(len(df)):
    q=df.iloc[j,2]
    w=df.iloc[j,8]
    if (q=='男') and (w>0x5A):
        lab_sco.append(j)
e=df.iloc[lab_sco,[1,9]]
print(e)
#############end#############

#6.将当前dataframe保存到文件scores_new.xls中
############begin############
rf.to_excel('scores_new.xls',index = False,encoding = "utf-8") 
#############end#############

scores.xls内容:

学号 姓名 性别 学校名称 学院名称 班级名称 考勤 实验 *** 作 实验报告  

201588010101 张三 男 湖南大学 信息科学与工程学院 班级1 100 80 87.5

 201588010102 李四 男 湖南大学 信息科学与工程学院 班级1 90 92 87.5

 201588010103 王五 男 湖南大学 信息科学与工程学院 班级1 90 80 87.5

 201588010104 赵六 男 湖南大学 信息科学与工程学院 班级1 100 80 92.5

 201588010105 马齐 女 湖南大学 信息科学与工程学院 班级1 90 60 90.0

 201588010106 高松 女 湖南大学 信息科学与工程学院 班级1 100 80 90.0

 201588010107 杨小 女 湖南大学 信息科学与工程学院 班级1 100 89 92.5

 201588010108 皮蓝 女 湖南大学 信息科学与工程学院 班级1 90 60 90.0

 201588010109 吕一 男 湖南大学 信息科学与工程学院 班级1 100 76 92.5

 201588010110 汪宏 女 湖南大学 信息科学与工程学院 班级1 100 83 90.0

 201588010111 张加 女 湖南大学 信息科学与工程学院 班级1 100 93 90.0

 201588010112 张明 女 湖南大学 信息科学与工程学院 班级1 100 79 90.0

 201588010113 魏森 男 湖南大学 信息科学与工程学院 班级1 100 68 82.5

 201588010201 王宏 男 湖南大学 信息科学与工程学院 班级2 100 87 90.0

 201588010202 杨小欢 女 湖南大学 信息科学与工程学院 班级2 100 80 92.5

 201588010203 马留 女 湖南大学 信息科学与工程学院 班级2 100 93 92.5

 201588010204 杨看看 女 湖南大学 信息科学与工程学院 班级2 90 68 82.5

 201588010205 卓建 男 湖南大学 信息科学与工程学院 班级2 100 73 90.0

 201588010206 梁封 女 湖南大学 信息科学与工程学院 班级2 90 78 92.5

 201588010207 王皮 女 湖南大学 信息科学与工程学院 班级2 100 89 97.5

 201588010208 李家 男 湖南大学 信息科学与工程学院 班级2 90 80 90.0

 201588010209 田一心 女 湖南大学 信息科学与工程学院 班级2 100 91 92.5

 201588010210 尹空 女 湖南大学 信息科学与工程学院 班级2 90 80 92.5

 201588010212 刘幂 男 湖南大学 信息科学与工程学院 班级2 80 80 60.0

 201588010213 蔡连 男 湖南大学 信息科学与工程学院 班级2 80 80 60.0

 201588010214 王未 女 湖南大学 信息科学与工程学院 班级2 80 80 92.5

 201588010215 李冰 女 湖南大学 信息科学与工程学院 班级2 80 79 87.5

 201588010216 文虹杨 女 湖南大学 信息科学与工程学院 班级2 80 73 87.5

 201588010217 罗部 男 湖南大学 信息科学与工程学院 班级2 100 78 92.5

 201588010218 水草 女 湖南大学 信息科学与工程学院 班级2 100 89 97.5

 201588010219 潘星 女 湖南大学 信息科学与工程学院 班级2 90 60 92.5

 201588010220 刘夸 女 湖南大学 信息科学与工程学院 班级2 100 85 92.5

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5578835.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存