Python初学者:“==”and“is”的区别是什么?

本文转载自公众号“读芯术”(ID:AI_Discovery)。

几天前,我在Reddit上浏览“learn python”板块的相关内容时,看到一位Reddit用户再次提问了这个问题:“==” and “is”的区别是什么?虽然网上对此问题已经有太多的答案和解释,但是很多初学者还是不知道,还是会犯错。

Python初学者:“==”and“is”的区别是什么?

“==”和“is”都是Python中的运算符。初学者可能会把“a == b”理解为“a等于b”,而把“a is b” 理解为 “a is b”。也许这就是Python初学者混淆“==”和“is”的原因。

在深入讨论之前,我想先举几个“==” 和 “is”的用例:

>>> a = 5 
>>> b = 5 
>>> a == bTrue>>> a is b 
True 

简单吧?a== b 和 a is b 都能返回 True。下一个例子:

>>> a = 1000 
>>> b = 1000 
>>> a == bTrue>>> a is b 
False 

这是为什么?第二个例子与第一个唯一的不同就在于a和b的值从5变成了1000,但是“==” 和 “is”输出的结果却完全不同。再看下一例:

>>> a = [] 
>>> b = []>>> a == bTrue>>> a is b 
False 

如果这还不够震惊,再看最后一个例子:

>>> a = 1000 
>>> b = 1000 
>>> a == bTrue>>> a is b 
False>>> a = b>>> a == bTrue>>> a is b 
True 

“==”的正式运算是相等,而“is”的运算是标识。用“==”是比较两个对象的值。“a == b”应解释为“a的值是否等于b的值”。在上述所有示例中,a的值始终等于b的值(即使对于空列的示例也是如此),因此“a == b”始终为真。

在解释标识的概念之前,我需要先介绍一下id函数。对象的标识可以通过id函数来获得。一个对象的标识始终是唯一且恒定的,你可以将其视为该对象的地址。如果两个对象的标识相同,则它们的值也一定相同。

>>> id(a) 
2047616 

运算符“is”用于比较两个对象的标识是否相同,“a is b”就表示“a的标识与b的标识相同”。

Python初学者:“==”and“is”的区别是什么?

图源:unsplash

现在你知道了“==”和“is”的真正含义,我们就可以开始深入讨论上述示例。

首先是第一例和第二例的结果差异。因为Python存储了一个介于-5到256之间的整数数组列表,每一个整数都有固定的对应标识。当你在此范围内分配整数变量时,Python就会将此变量作为数组列里的整数为其分配标识。

因此,在第一例中,由于a和b的标识都是从数组列表中获得的,所以他们的标识当然相同,因此a is b为真。

>>> a = 5 
>>> id(a) 
1450375152 
>>> b = 5 
>>> id(b) 
1450375152 

但一旦变量的值不在这个区间范围内,由于Python内部没有对应该值的对象,因此Python将为此变量创建新的标识,并为这个变量赋值。

如前所述,每个创建的标识都是唯一的,因此即使两个变量的值相同,他们的标识也永远不会等同。这就是为什么第二例中的a is b返回False。

>>> a = 1000 
>>> id(a) 
12728608 
>>> b = 1000 
>>> id(b) 
13620208 

另外,假设你打开的是两个控制台,如果该值仍在区间内,也能得到相同标识。但是,如果该值不在区间内,结果当然就不同了。

Python初学者:“==”and“is”的区别是什么?

一旦理解了第一例和第二例的区别,就很容易理解第三例的结果了。由于Python不存储“空列表”对象,所以Python创建了一个新对象并赋值“空列表”。无论这两个列表是空还是元素相同,结果都是一样的。

>>> a = [1,10,100,1000] 
>>> b = [1,10,100,1000] 
>>> a == bTrue>>> a is bFalse>>> id(a) 
12578024 
>>> id(b) 
12578056 

来看最后一例。第二例与最后一例的唯一区别在于多了一行代码a = b。然而,这行代码却改变了变量a的命运。下面的结果将阐述原因:

>>> a = 1000 
>>> b = 2000 
>>> id(a) 
2047616 
>>> id(b) 
5034992 
>>> a = b>>> id(a) 
5034992 
>>> id(b) 
5034992 
>>> a2000>>> b2000 

可以看到,在a= b之后,a的标识变成了b的标识。a = b把b的标识赋予了a。因此a和b就拥有了相同的标识,a的值现在就等于b的值,即2000。

最后一例传达出一个重要信息,即你可能在不经意间更改了对象的值,尤其是当对象为列表时。

>>> a = [1,2,3] 
>>> id(a) 
5237992 
>>> b = a 
>>> id(b) 
5237992 
>>> a.append(4) 
>>> a 
[1, 2, 3, 4] 
>>> b 
[1, 2, 3, 4] 

从上例可以看出,a和b拥有相同的标识,他们的值就一定相同。因此在为a附加了一个新元素后,b的值也会受到影响。为了避免这种情况,如果要把一个对象的值复制到另一对象,又不引用同一标识,一个方法是在copy模块中使用deepcopy。对于列表,你还可以通过b= a[:]来实现。

>>> import copy 
>>> a = [1,2,3] 
>>> b= copy.deepcopy(a) 
>>> id(a) 
39785256 
>>> id(b) 
5237992 

使用[:]把元素复制到新变量:

>>> a = [1,2,3] 
>>> id(a) 
39785256 
>>> b = a[:] 
>>> id(b) 
23850216 
>>> a.append(4) 
>>> a 
[1, 2, 3, 4] 
>>> b 
[1, 2, 3]