查找非零元素的索引并按值分组

食品追溯 • 2022-12-16 • 随笔 • 阅读 70

查找非零元素的索引并按值分组

这是针对您的问题的O（n log n）算法。显而易见的循环解决方案是O（n），因此对于足够大的数据集，这会更慢：

>>> a = np.random.randint(3, size=10)>>> aarray([1, 2, 2, 0, 1, 0, 2, 2, 1, 1])>>> index = np.arange(len(a))>>> sort_idx = np.argsort(a)>>> cnt = np.bincount(a)>>> np.split(index[sort_idx], np.cumsum(cnt[:-1]))[array([3, 5]), array([0, 4, 8, 9]), array([1, 2, 6, 7])]

这将取决于您的数据大小，但是对于大型数据集来说，这是相当快的：

In [1]: a = np.random.randint(1000, size=1e6)In [2]: %%timeit   ...: indices = np.arange(len(a))   ...: sort_idx = np.argsort(a)   ...: cnt = np.bincount(a)   ...: np.split(indices[sort_idx], np.cumsum(cnt[:-1]))   ...: 10 loops, best of 3: 140 ms per loop

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5663488.html

数据显而易见分组算法取决于

打赏

微信扫一扫

支付宝扫一扫

食品追溯一级用户组

0 0

从Python中的字符串确定“值的类型”

上一篇 2022-12-16

破坏性堆栈迭代

下一篇 2022-12-16

发表评论

登录后才能评论

查找非零元素的索引并按值分组

发表评论

评论列表（0条）