基于Python对象引用、可变性和垃圾回收详解_python

概述变量不是盒子在示例所示的交互式控制台中，无法使用“变量是盒子”做解释。图说明了在Python中为什么不能使用盒子比喻，而便利贴则指出了变量的正确工作方式。

变量不是盒子

在示例所示的交互式控制台中，无法使用“变量是盒子”做解释。图说明了在 Python 中为什么不能使用盒子比喻，而便利贴则指出了变量的正确工作方式。

变量 a 和 b 引用同一个列表，而不是那个列表的副本

>>> a = [1,2,3]>>> b = a>>> a.append(4)>>> b[1,3,4]

如果把变量想象为盒子，那么无法解释 Python 中的赋值；应该把变量视作便利贴，这样示例中的行为就好解释了

注意：

对引用式变量来说，说把变量分配给对象更合理，反过来说就有问题。毕竟，对象在赋值之前就创建了

标识、相等性和别名

Lewis Carroll 是 Charles LutwIDge Dodgson 教授的笔名。Carroll 先生指的就是 Dodgson 教授，二者是同一个人。🌰 用 Python 表达了这个概念。

charles 和 lewis 指代同一个对象

>>> lewis = charles>>> lewis is charlesTrue>>> ID(lewis),ID(charles)(4303312648,4303312648)>>> lewis['balance'] = 950>>> charles{'name': 'Charles L. Dodgson','born': 1832,'balance': 950}

然而，假如有冒充者（姑且叫他 Alexander Pedachenko 博士）生于 1832年，声称他是 Charles L. Dodgson。这个冒充者的证件可能一样，但是Pedachenko 博士不是 Dodgson 教授。这种情况如图

charles 和 lewis 绑定同一个对象，alex 绑定另一个具有相同内容的对象

alex 与 charles 比较的结果是相等，但 alex 不是charles

>>> lewis{'name': 'Charles L. Dodgson','balance': 950}>>> alex = {'name': 'Charles L. Dodgson','balance': 950}>>> lewis == alexTrue>>> alex is not lewisTrue

alex 指代的对象与赋值给 lewis 的对象内容一样，比较两个对象，结果相等，这是因为 dict 类的 __eq__ 方法就是这样实现的，但它们是不同的对象。这是 Python 说明标识不同的方式：a is notb。

示例体现了别名。在那段代码中，lewis 和 charles 是别名，即两个变量绑定同一个对象。而 alex 不是 charles 的别名，因为二者绑定的是不同的对象。alex 和 charles 绑定的对象具有相同的值（== 比较的就是值），但是它们的标识不同。

在==和is之间选择

== 运算符比较两个对象的值（对象中保存的数据），而 is 比较对象的标识。通常，我们关注的是值，而不是标识，因此 Python 代码中 == 出现的频率比 is 高。然而，在变量和单例值之间比较时，应该使用 is。目前，最常使用 is检查变量绑定的值是不是 None。下面是推荐的写法：

x is None

否定的写法

x is not None

元组的相对不可变性

元组与多数 Python 集合（列表、字典、集，等等）一样，保存的是对象的引用。如果引用的元素是可变的，即便元组本身不可变，元素依然可变。也就是说，元组的不可变性其实是指 tuple 数据结构的物理内容（即保存的引用）不可变，与引用的对象无关。

>>> t1 = (1,[30,40])>>> t2 = (1,40])>>> t1 == t2True>>> ID(t1[-1])>>> t1[-1].append(1000)>>> t1(1,40,1000])>>> t1 == t2False

表明，元组的值会随着引用的可变对象的变化而变。元组中不可变的是元素的标识。

默认做浅复制

复制列表（或多数内置的可变集合）最简单的方式是使用内置的类型构造方法。例如：

>>> l1 = [3,[55,44],(7,8,9)]>>> l2 = List(l1)>>> l3 = l1[:]>>> l2[3,9)]>>> l3[3,9)]>>> l1 == l2 == l3True>>> l2 is l1False>>> l3 is l1False

为一个包含另一个列表的列表做浅复制；把这段代码复制粘贴到 Python Tutor (http://www.pythontutor.com)网站中，看看动画效果

l1 = [3,[66,55,9)]l2 = List(l1)    #浅复制了l1l1.append(100)    #l1列表在尾部添加数值100l1[1].remove(55)   #移除列表中第1个索引的值print('l1:',l1)print('l2:',l2)l2[1] += [33,22]   #l2列表中第1个索引做列表拼接l2[2] += (10,11)   #l2列表中的第2个索引做元祖拼接print('l1:',l2)

l2 是 l1 的浅复制副本

为任意对象做深复制和浅复制

浅复制没什么问题，但有时我们需要的是深复制（即副本不共享内部对象的引用）。copy 模块提供的 deepcopy 和 copy 函数能为任意对象做深复制和浅复制。

校车乘客在途中上车和下车

class Bus: def __init__(self,passengers=None):  if passengers is None:   self.passengers = []  else:   self.passengers = List(passengers) def pick(self,name):  self.passengers.append(name) def drop(self,name):  self.passengers.remove(name)

我们将创建一个 Bus 实例（bus1）和两个副本，一个是浅复制副本（bus2），另一个是深复制副本（bus3），看看在 bus1 有学生下车后会发生什么。

from copy import copy,deepcopybus1 = Bus(['Alice','Bill','Claire','DavID'])bus2 = copy(bus1)      #bus2浅复制的bus1bus3 = deepcopy(bus1)     #bus3深复制了bus1print(ID(bus1),ID(bus2),ID(bus3))  #查看三个对象的内存地址bus1.drop('Bill')      #bus1的车上Bill下车了print('bus2:',bus2.passengers)   #wtf....bus2中的Bill也没有了，见鬼了！print(ID(bus1.passengers),ID(bus2.passengers),ID(bus3.passengers)) #审查 passengers 属性后发现，bus1和bus2共享同一个列表对象，因为 bus2 是 bus1 的浅复制副本print('bus3:',bus3.passengers)   #bus3是bus1 的深复制副本，因此它的 passengers 属性指代另一个列表

以上代码执行的结果为：

4324829840 4324830176 4324830736bus2: ['Alice','DavID']4324861256 4324861256 4324849608bus3: ['Alice','DavID']

循环引用：b 引用 a，然后追加到 a 中；deepcopy 会想办法复制 a

>>> a = [10,20]>>> b = [a,30]>>> a.append(b)>>> a[10,20,[[...],30]]>>> from copy import deepcopy>>> c = deepcopy(a)>>> c[10,30]]

函数的参数作为引用时

Python 唯一支持的参数传递模式是共享传参（call by sharing）。多数面向对象语言都采用这一模式，包括 Ruby、Smalltalk 和 Java（Java 的引用类型是这样，基本类型按值传参）。共享传参指函数的各个形式参数获得实参中各个引用的副本。也就是说，函数内部的形参是实参的别名。

函数可能会修改接收到的任何可变对象

>>> def f(a,b):...  a += b...  return a... >>> x = 1>>> y = 2>>> f(x,y)>>> x,y(1,2)>>> a = [1,2]>>> b = [3,4]>>> f(a,b)[1,4]>>> a,b([1,4],[3,4])>>> t = (10,20)>>> u = (30,40)>>> f(t,u)(10,30,40)>>> t,u((10,20),(30,40))

数字x没有变化，列表a变了，元祖t没变化

不要使用可变类型作为参数的默认值

可选参数可以有默认值，这是 Python 函数定义的一个很棒的特性，这样我们的 API 在进化的同时能保证向后兼容。然而，我们应该避免使用可变的对象作为参数的默认值。

一个简单的类，说明可变默认值的危险

class HauntedBus: ''' 备受折磨的幽灵车 ''' def __init__(self,passengers=[]):  self.passengers = passengers def pick(self,name):  self.passengers.remove(name)bus1 = HauntedBus(['Alice','Bill'])print('bus1上的乘客：',bus1.passengers)bus1.pick('CharlIE')   #bus1上来一名乘客Charilebus1.drop('Alice')    #bus1下去一名乘客Aliceprint('bus1上的乘客：',bus1.passengers)   #打印bus1上的乘客bus2 = HauntedBus()    #实例化bus2bus2.pick('CarrIE')    #bus2上来一名课程CarrIEprint('bus2上的乘客：',bus2.passengers)bus3 = HauntedBus()print('bus3上的乘客：',bus3.passengers)bus3.pick('Dave')print('bus2上的乘客：',bus2.passengers)  #登录到bus3上的乘客Dava跑到了bus2上面print('bus2是否为bus3的对象：',bus2.passengers is bus3.passengers)print('bus1上的乘客：',bus1.passengers)

以上代码执行的结果为：

bus1上的乘客： ['Alice','Bill']bus1上的乘客： ['Bill','CharlIE']bus2上的乘客： ['CarrIE']bus3上的乘客： ['CarrIE']bus2上的乘客： ['CarrIE','Dave']bus2是否为bus3的对象： Truebus1上的乘客： ['Bill','CharlIE']

实例化 HauntedBus 时，如果传入乘客，会按预期运作。但是不为 HauntedBus 指定乘客的话，奇怪的事就发生了，这是因为 self.passengers 变成了 passengers 参数默认值的别名。出现这个问题的根源是，默认值在定义函数时计算（通常在加载模块时），因此默认值变成了函数对象的属性。因此，如果默认值是可变对象，而且修改了它的值，那么后续的函数调用都会受到影响。

防御可变参数

如果定义的函数接收可变参数，应该谨慎考虑调用方是否期望修改传入的参数。

例如，如果函数接收一个字典，而且在处理的过程中要修改它，那么这个副作用要不要体现到函数外部？具体情况具体分析。这其实需要函数的编写者和调用方达成共识。

TwilightBus 实例与客户共享乘客列表，这会产生意料之外的结果。在分析实现之前，我们先从客户的角度看看 TwilightBus 类是如何工作的。

从 TwilightBus 下车后，乘客消失了

class TwilightBus: """让乘客销声匿迹的校车""" def __init__(self,passengers=None):  if passengers is None:   self.passengers = passengers  else:   self.passengers = passengers #这个地方就需要注意了,这里传递的是引用的别名 def pick(self,name):  self.passengers.append(name)  #会修改构造放的列表，也就是会修改外部的数据 def drop(self,name):  self.passengers.remove(name)  #会修改构造放的列表，也就是会修改外部的数据basketball_team = ['Sue','Tina','Maya','Diana','Pat']bus = TwilightBus(basketball_team)bus.drop('Tina')  #bus中乘客Tina下去了bus.drop('Pat')   #bus中课程Pat下去了print(basketball_team) #wtf....为毛线的basketball的里面这两个人也木有了~~MMP

以上代码执行的结果为：

['Sue','Diana']

解决方案，不直接引用外部的basketball_team，而是在内部创建一个副本，类似于下面的这种

>>> a = [1,3]>>> b = a>>> c = List(a)>>> b.append(10)>>> a[1,10]>>> b[1,10]>>> c[1,3]

c是a的副本，不会因为本身列表的变化而受影响，在上面的 🌰 中，只需要在构造函数中创建一个副本即可(self.passengers=List(passengers))

del和垃圾回收

del 语句删除名称，而不是对象。del 命令可能会导致对象被当作垃圾回收，但是仅当删除的变量保存的是对象的最后一个引用，或者无法得到对象时。重新绑定也可能会导致对象的引用数量归零，导致对象被销毁。

>>> import weakref>>> s1 = {1,3}>>> s2 = s1　#s1和s2是别名，指向同一个集合>>> def bye():　#这个函数一定不能是要销毁的对象的绑定方法，否则会有一个指向对象的引用...  print('Gone with the wind...')... >>> ender = weakref.finalize(s1,bye)　#在s1引用的对象上注册bye回调　>>> ender.alive#调用finalize对象之前，.alive属性的值为TrueTrue>>> del s1　#del不删除对象，而是删除对象的引用>>> ender.aliveTrue>>> s2 = 'spam'　 #重新绑定最后一个引用s2，让{1,3}无法获取，对象呗销毁了，调用bye回调，ender.alive的值编程了FalseGone with the wind...>>> ender.aliveFalse

弱引用

正是因为有引用，对象才会在内存中存在。当对象的引用数量归零后，垃圾回收程序会把对象销毁。但是，有时需要引用对象，而不让对象存在的时间超过所需时间。这经常用在缓存中。

弱引用不会增加对象的引用数量。引用的目标对象称为所指对象（referent）。因此我们说，弱引用不会妨碍所指对象被当作垃圾回收。

弱引用是可调用的对象，返回的是被引用的对象；如果所指对象不存在了，返回 None

>>> import weakref>>> a_set = {0,1}>>> wref = weakref.ref(a_set)#创建弱引用对象wref，下一行审查它>>> wref<weakref at 0x101ce03b8; to 'set' at 0x101cd8d68>>>> wref()　#调用wref()返回的是被引用的对象，{0,1}。因为这是控制台会话，所以{0,1}会绑定给_变量{0,1}>>> a_set = {2,4} #a_set不在指代{0， 1}集合，因此集合的引用数量减少了，但是_变量仍然指代它>>> wref() #调用wref()已经返回了{0， 1}{0,1}>>> wref() is None#计算这个表达式时，{0， 1}存在，因此wref()不是None，但是，随后_绑定到结果值False，现在{0，1}没有强引用False>>> wref() is None#因为{0， 1}对象不存在了，所以wref()返回了NoneTrue

以上这篇基于Python对象引用、可变性和垃圾回收详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持编程小技巧。

总结

以上是内存溢出为你收集整理的基于Python对象引用、可变性和垃圾回收详解全部内容，希望文章能够帮你解决基于Python对象引用、可变性和垃圾回收详解所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1201702.html

基于Python对象引用、可变性和垃圾回收详解

发表评论

评论列表（0条）