【Python系列专栏】第六十五篇 Python中 Pandas 数据转换

【Python系列专栏】第六十五篇 Python中 Pandas 数据转换,第1张

概述7.2数据转换Pandas另一类重要 *** 作是过滤、清理以及其他的转换工作。7.2.1移除重复数据​DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行(前面出现过的行)。还有一个与此相关的drop_duplicates方法,它会返回一个DataFrame,重复的数组会标为False。【 7.2 数据转换

Pandas 另一类重要 *** 作是过滤、清理以及其他的转换工作。

7.2.1 移除重复数据

​ DataFrame的duplicated方法返回一个布尔型SerIEs,表示各行是否是重复行(前面出现过的行)。还有一个与此相关的drop_duplicates方法,它会返回一个DataFrame,重复的数组会标为False。【这两种方法默认会判断全部列,也可以指定部分列进行重复项判断。例如,只希望根据某一列过滤重复项,只需要传参到上面的方法中。】

duplicated和drop_duplicates默认保留的是第一个出现的值组合。传入keep=‘last’则保留最后一个。


7.2.2 利用函数或映射进行数据转换

​ 希望根据数组、SerIEs或DataFrame列中的值来实现转换工作。

​ SerIEs的map方法可以接受一个函数或含有映射关系的字典型对象,但是如果碰到一些映射的对象中有些值的首字母大写了,而有些则没有,就需要使用SerIEsstr.lower方法,将各个值转换为小写。

​ 例如:

lowercased=data[
总结

以上是内存溢出为你收集整理的【Python系列专栏】第六十五篇 Python中 Pandas 数据转换全部内容,希望文章能够帮你解决【Python系列专栏】第六十五篇 Python中 Pandas 数据转换所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/1186592.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存