我正在寻找最快的方法来做到这一点.
目前我循环遍历数组并使用numpy.dstack将1000个数组堆叠成一个相当大的3d数组…然后将计算第3(?)维度的平均值.每个阵列都有形状(5000,4000).
这种方法需要相当长的时间!
有人能够建议更有效的方法来解决这个问题吗?
解决方法 也许你可以用累积的方式计算mean和std(未经测试):im_size = (5000,4000)cum_sum = np.zeros(im_size)cum_sum_of_squares = np.zeros(im_size)n = 0for filename in filenames: image = read_your_image(filename) cum_sum += image cum_sum_of_squares += image**2 n += 1mean_image = cum_sum / nstd_image = np.sqrt(cum_sum_of_squares / n - (mean_image)**2)
这可能受限于您从磁盘读取图像的速度.它不受内存限制,因为您一次只在内存中有一个图像.以这种方式计算std可能会遇到数值问题,因为你可能会减去两个大数.如果这是一个问题,你必须循环文件两次,首先计算均值,然后在第二遍中累积(image – mean_image)** 2.
总结以上是内存溢出为你收集整理的python – 计算1000个数组的统计数据全部内容,希望文章能够帮你解决python – 计算1000个数组的统计数据所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)