数据透视表是一种对大量数据快速汇总和建立交叉列表的交互式表格
数据透视表能帮助用户分析、组织数据。利用它可以很快地从不同角度对数据进行分类汇兑
记录数量众多、以流水帐形式记录、结构复杂的工作表,为了将其中的一些内在规律显现出来,可将工作表重新组合并添加算法。即建立数据透视表。
例如,如果要按季度来分析每个雇员的销售业绩,可以将雇员名称作为列标放在数提透视表的顶端,将季度名称作为行号放在表的左侧,然后对每一个雇员计算以季度分类能销售数量,放在每个行和列的交汇处。之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。
透视表是一种可以对数据 动态排布 并且 分类汇总 的表格格式。或许大多数人都在Excel使用过数据透视表(如下图),也体会到它的强大功能,而在pandas中它被称作pivot_table。
Excel中的数据透视表</figcaption>
首先读取数据,作为一个老火密,本文将火箭队当家吉祥物James_Harden本赛季比赛数据作为数据集进行讲解,就是下面这个大胡子。
最后5场比赛数据
pivot_table有四个最重要的参数 index、values、columns、aggfunc ,本文以这四个参数为中心讲解pivot *** 作是如何进行。
每个pivot_table必须拥有一个 index , 如果想查看哈登对阵每个队伍的得分,首先我们将 对手 设置为 index :
对手 成为了第一层索引,还想看看对阵 同一对手在不同主客场下的数据 ,试着将 对手 与 胜负 与 主客场 都设置为 index
试着交换下它们的顺序,数据结果一样:
看完上面几个 *** 作, Index就是层次字段,要通过透视表获取什么信息就按照相应的顺序设置字段 ,所以在进行pivot之前你也需要足够了解你的数据。
通过上面的 *** 作,我们获取了james harden在对阵对手时的 所有数据 ,而Values可以对需要的计算数据进行筛选,如果我们只需要james harden在主客场和不同胜负情况下的得分、篮板与助攻三项数据:
aggfunc参数可以设置我们对数据聚合时进行的函数 *** 作。
当我们未设置aggfunc时,它默认 aggfunc='mean' 计算均值。我们还想要获得james harden在主客场和不同胜负情况下的 总 得分、 总 篮板、 总 助攻时:
Columns类似Index可以设置 列层次字段 ,它不是一个必要参数,作为一种分割数据的可选方式。
我是上表
你应该理解了pivot_table的用法?是不是在哪见过?
对,Groupby!
上面两个函数完全等价,pivot_table仿佛是加入了columns与margin功能的groupby函数,比groupby更加灵活。
当表格生成后如何查询某一项数据呢?
ex根据 上表 查询哈登对阵灰熊时的数据
统计哈登不同主客场与胜负下的场数以及投篮命中率(哈登在主场且胜利的场数以及在这种情况下的投篮命中率)
Excel数据透视表一般是用来统计分析数据的
提取数据,比如提取一列中的不重复数据
可以用数据透视表,把这列放到行标签里
然后复制数据透视表中的第一列,粘贴就可以了
以上就是关于excel中的数据透视是什么意思,要怎么才能提取数据全部的内容,包括:excel中的数据透视是什么意思,要怎么才能提取数据、一文看懂透视表pivot_table、怎样把透视表中的数据提取出来 谢谢您啦等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)