您可以将数据
stack框转换为单列(将形状从5x3更改为15x1),然后采用标准偏差:
df.stack().std() # pandas default degrees of freedom is one
或者,您可以
values在采用标准差之前使用来将熊猫数据框转换为numpy数组:
df.values.std(ddof=1) # numpy default degrees of freedom is zero
与pandas不同,numpy默认情况下会给出整个数组的标准差,因此在进行标准差处理之前无需重塑形状。
另外一些注意事项:
这里的numpy方法比熊猫方法要快一些,当您可以选择用numpy或pandas完成相同的事情时,通常情况就是这样。速度差异取决于数据的大小,但是当我在笔记本电脑(numpy版本1.15.4和pandas版本0.23.4)上测试一些不同大小的数据帧时,numpy的速度大约快10倍。
此处的numpy和pandas方法不会给出完全相同的答案,但将非常接近(相同的精度为几位数)。差异是由于在幕后的实现中存在细微差异,这些差异会影响浮点值的取整方式。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)