导入模块
import pandas as pd import numpy as np
1.排序
numpy.random.permutation()函数
创建一个Dataframe
frame = pd.Dataframe(np.arange(25).reshape(5,5)) frame
利用permutation()函数 创建一个0~4的5个整数数组,按照这个整数数组元素对Dataframe随机排序
new_order = np.random.permutation(5) new_order ''' array([4, 0, 2, 3, 1]) '''
借助take()函数 把新的次序传入Dataframe对象
frame.take(new_order)
也可只对部分数据指定排序
new_order = [3,4,0] frame.take(new_order)
2.随机取样
frame = pd.Dataframe(np.arange(25).reshape(5,5)) sample = np.random.randint(0,len(frame),size=3) sample ''' array([3, 0, 4]) '''
frame.take(sample)
参考:
法比奥·内利. Python数据分析实战:第2版.北京:人民邮电出版社, 2019.11.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)