pandas数据处理学习笔记(五)

pandas数据处理学习笔记(五),第1张

pandas数据处理学习笔记(五)

导入模块

import pandas as pd
import numpy as np

1.排序

numpy.random.permutation()函数 

创建一个Dataframe

frame = pd.Dataframe(np.arange(25).reshape(5,5))
frame

利用permutation()函数 创建一个0~4的5个整数数组,按照这个整数数组元素对Dataframe随机排序

new_order = np.random.permutation(5)
new_order
'''
array([4, 0, 2, 3, 1])
'''

借助take()函数 把新的次序传入Dataframe对象

frame.take(new_order)

也可只对部分数据指定排序 

new_order = [3,4,0]
frame.take(new_order)

2.随机取样

frame = pd.Dataframe(np.arange(25).reshape(5,5))
sample = np.random.randint(0,len(frame),size=3)
sample
'''
array([3, 0, 4])
'''
frame.take(sample)


参考:

法比奥·内利. Python数据分析实战:第2版.北京:人民邮电出版社, 2019.11.

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5680282.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存