初学者都在坑里!不要在Python中使用“+”来连接字符串
本文转载自公众号“读芯术”(ID:AI_Discovery)
很多初学者都像我一样,最开始使用Python时,会不自觉地使用“+”来连接字符串,就像在许多其他编程语言(比如Java)中那样,因为这样既直观又容易。
但我很快意识到成熟的开发人员似乎更喜欢使用.join()来连接字符串,而不是“+”。
你现在一定像我刚知道这一点时一样困惑。本文中,我将告诉你这两种方法之间的区别,以及为什么不应该使用“+”。
开始
作为一名初学者,或者刚从使用“+”连接字符串的其他编程语言切换过来的人,很顺手地就会写出这样的代码:
str1 =“I love” str2 =“Python.” print(str1 + str2)
但时间久了,你或许或许就会发现,别人都是这样写的:
str1 =“I love” str2 =“Python.” print(''.join([str1,str2]))
实话说,当我第一次看到上述方法时,我认为这既不直观也不美观。
连接多个字符串
转折发生在不久之后,有一次我需要连接列表中的多个字符串。
strs = ['Life','is','short','I','use','Python']
最初,我是这样做的:
strs = ['Life', 'is', 'short,','I', 'use', 'Python']def join_strs(strs): result = '' for s in strs: result += ' ' + s return result[1:]join_strs(strs)
我必须编写一个for循环来逐个连接字符串。另外,结果字符串前需要删除我在开头添加的空格,因为所有字符串都需要在前面添加空格,而不是单是开头。
或许你有其他解决方案,例如将索引添加到for循环中,这样就不应将index=0处的字符串添加到此空格处。无论如何,你仍然需要使用此for循环并为空格做些什么。
这时,我回想起以前曾经看过.join()方法,灵光乍现,也许这正是我需要使用它的时候!
超轻松解决了!一行代码可以完成所有工作。由于.join()方法是由字符串对象调用的,该字符串对象将用于连接列表中的每个字符串,因此你无需担心开头的空格。
但这不是我们需要使用join()而不是“+”方法的唯一原因。
join()方法背后的逻辑
让我们来比较一下这两种方法的性能,使用Jupyter Notebook的魔术方法%timeit来对其进行评估。
上面显示的性能基于10万条路径,结果是非常可信且显而易见的。使用join()方法可能比使用“+”来连接列表中的字符串快4倍。
这是为什么呢?看看我绘制的概念图,用于演示使用“+”连接字符串的方法:
这显示了for循环和“+”运算符的作用:
- 对于每个循环,都可以从列表中找到字符串
- 对于每个循环,执行程序将需要申请两次内存地址,一次用于空格,另一次用于字符串。
- Python执行程序解释表达式result + =''+s并为空格申请内存地址。
- 然后,执行程序意识到空格需要与字符串连接,因此它将为字符串s申请内存地址,这是第一个循环“life”。
- 其中还存在12次内存分配。
那么,使用join()方法发生了什么?
- 执行程序将计算列表中有多少个字符串。这里有6个。
- 这意味着用于连接列表的字符串需要重复6-1 =5次。
- 这里总共需要11个内存空间,因此所有的这些空间将被立即应用并被预先分配。
- 然后按顺序排列字符串,再返回结果页面。
很明显,主要的区别在于内存分配的次数,这就是提高性能的主要原因。想象一下,使用join()方法将6个字符串连接在一起,速度已经快了4倍。如果我们连接了大量的字符串呢?它将发生更大的变化!
在Python中连接字符串时,显然,考虑到其性能,join()方法是首选。