python – Numpy矢量化算法,用相同的时间戳来总结数字

python – Numpy矢量化算法,用相同的时间戳来总结数字,第1张

概述我有两个数组P和T. P [i]是一个数字,其时间戳是T [i];可能存在重复的时间戳. 我想生成另外两个数组Q和U,其中Q [i]具有时间戳U [i],并且Q [i]是P中具有时间戳U [i]的所有元素的总和; 例如,对于 P = [1,2,3,4,5] T = [0,0,1,1,1] 我会生产 Q = [3,12] U = [0,1]; 有没有一种快速的方法在numpy中这样做,希望它可以矢量 我有两个数组P和T. P [i]是一个数字,其时间戳是T [i];可能存在重复的时间戳.

我想生成另外两个数组Q和U,其中Q [i]具有时间戳U [i],并且Q [i]是P中具有时间戳U [i]的所有元素的总和;

例如,对于

P = [1,2,3,4,5]
T = [0,1,1]

我会生产

Q = [3,12]
U = [0,1];

有没有一种快速的方法在numpy中这样做,希望它可以矢量化它?

解决方法 使用numpy 1.4或更高版本:

import numpy as npP = np.array([1,5]) T = np.array([0,1])U,inverse = np.unique(T,return_inverse=True)Q = np.bincount(inverse,weights=P)print (Q,U)# (array([  3.,12.]),array([0,1]))

请注意,这不是最快的解决方案.我用这种方式测试速度:

import numpy as npN = 1000P = np.repeat(np.array([1,5]),N)T = np.repeat(np.array([0,1]),N)def using_bincount():    U,return_inverse=True)    Q = np.bincount(inverse,weights=P)    return Q,U    # (array([  3.,1]))def using_lc():    U = List(set(T))    Q = [sum([p for (p,t) in zip(P,T) if t == u]) for u in U]    return Q,Udef using_slice():    U = np.unique(T)    Q = np.array([P[T == u].sum() for u in U])    return Q,U

对于小型阵列,wim’s solution更快(N = 1):

% python -mtimeit -s'import test' 'test.using_lc()'100000 loops,best of 3: 18.4 usec per loop% python -mtimeit -s'import test' 'test.using_slice()'10000 loops,best of 3: 66.8 usec per loop% python -mtimeit -s'import test' 'test.using_bincount()'10000 loops,best of 3: 52.8 usec per loop

对于大型阵列,joris’s solution更快(N = 1000):

% python -mtimeit -s'import test' 'test.using_lc()'100 loops,best of 3: 9.93 msec per loop% python -mtimeit -s'import test' 'test.using_slice()'1000 loops,best of 3: 390 usec per loop% python -mtimeit -s'import test' 'test.using_bincount()'1000 loops,best of 3: 846 usec per loop

我怀疑在这种情况下是否重要,但基准测试可能会根据numpy,python,OS或硬件的版本而改变.在您的机器上重复这些基准测试并不会有什么坏处.

总结

以上是内存溢出为你收集整理的python – Numpy矢量化算法,用相同的时间戳来总结数字全部内容,希望文章能够帮你解决python – Numpy矢量化算法,用相同的时间戳来总结数字所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1192625.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存