Python 中的sys模块极为基础而重要,它主要提供了一些给解释器使用(或由它维护)的变量,以及一些与解释器强交互的函数。
本文将会频繁地使用该模块的getsizeof()方法,因此,我先简要介绍一下:
• 该方法用于获取一个对象的字节大小(bytes)
• 它只计算直接占用的内存,而不计算对象内所引用对象的内存
这里有个直观的例子:
import sys a = [1, 2] b = [a, a] # 即 [[1, 2], [1, 2]] # a、b 都只有两个元素,所以直接占用的大小相等 sys.getsizeof(a) # 结果:80 sys.getsizeof(b) # 结果:80
上例说明了一件事:一个静态创建的列表,如果只包含两个元素,那它自身占用的内存就是 80 字节,不管其元素所指向的对象是什么。
好了,拥有这把测量工具,我们就来探究一下 Python 的内置对象都藏了哪些小秘密吧。
1、空对象不是“空”的!
对于我们熟知的一些空对象,例如空字符串、空列表、空字典等等,不知道大家是否曾好奇过,是否曾思考过这些问题:
空的对象是不是不占用内存呢?如果占内存,那占用多少呢?为什么是这样分配的呢?
直接上代码吧,一起来看看几类基本数据结构的空对象的大小:
import sys sys.getsizeof("") # 49 sys.getsizeof([]) # 64 sys.getsizeof(()) # 48 sys.getsizeof(set()) # 224 sys.getsizeof(dict()) # 240 # 作为参照: sys.getsizeof(1) # 28 sys.getsizeof(True) # 28
可见,虽然都是空对象,但是这些对象在内存分配上并不为“空”,而且分配得还挺大(记住这几个数字哦,后面会考)。
排一下序:基础数字 < 空元组 < 空字符串 < 空列表 < 空集合 < 空字典。
这个小秘密该怎么解释呢?
因为这些空对象都是容器,我们可以抽象地理解:它们的一部分内存用于创建容器的骨架、记录容器的信息(如引用计数、使用量信息等等)、还有一部分内存则是预分配的。
2、内存扩充不是均匀的!
空对象并不为空,一部分原因是 Python 解释器为它们预分配了一些初始空间。在不超出初始内存的情况下,每次新增元素,就使用已有内存,因而避免了再去申请新的内存。
那么,如果初始内存被分配完之后,新的内存是怎么分配的呢?
import sys letters = "abcdefghijklmnopqrstuvwxyz" a = [] for i in letters: a.append(i) print(f'{len(a)}, sys.getsizeof(a) = {sys.getsizeof(a)}') b = set() for j in letters: b.add(j) print(f'{len(b)}, sys.getsizeof(b) = {sys.getsizeof(b)}') c = dict() for k in letters: c[k] = k print(f'{len(c)}, sys.getsizeof(c) = {sys.getsizeof(c)}')
分别给三类可变对象添加 26 个元素,看看结果如何:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)