pandas去重

pandas去重,第1张

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

在处理pandas数据时,有时候需要删除重复数据,pandas为我们提供了drop_duplicates()函数。下面对其使用方法进行介绍:

keep:{‘first’, ‘last’, False}, 默认值 ‘first’


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9565203.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存