在数据分析中,经常会遇到这样的情况:根据某一列(或多列)标签把数据划分为不同的组别,然后再对其进行数据分析。比如,某网站对注册用户的性别或者年龄等进行分组,从而研究出网站用户的画像(特点)。在 Pandas 中,要完成数据的分组 *** 作,需要使用 groupby() 函数,它和 SQL 的GROUP BY *** 作非常相似。
在划分出来的组(group)上应用一些统计函数,从而达到数据分析的目的,比如对分组数据进行聚合、转换,或者过滤。这个过程主要包含以下三步:
拆分(Spliting):表示对数据进行分组;
应用(Applying):对分组数据应用聚合函数,进行相应计算;
合并(Combining):最后汇总计算结果。
下面对 groupby() 函数的应用过程进行具体的讲解。
创建DataFrame对象首先我们创建一个 DataFrame 对象,下面数据描述了某班学生,计算机选修课的考试成绩:
import pandas as pd
import numpy as np
data
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)