进入子shell的各种情况分析
子shell的概念贯穿整个shell,写shell脚本时更是不可不知。所谓子shell,即从当前shell环境新开一个shell环境,这个新开的shell环境就称为子shell(subshell),而开启子shell的环境称为该子shell的父shell。子shell和父shell的关系其实就是子进程和父进程的关系,只不过子shell和父shell是关联的进程是bash进程。
子shell会从父shell中继承很多环境,如变量、命令全路径、文件描述符、当前工作目录、陷阱等等,但子shell有很多种类型,不同类型的子shell继承的环境不相同。可以使用$BASH_SUBSHELL变量来查看从当前进程开始的子shell层数,$BASHPID查看当前所处BASH的PID,这不同于特殊变量"$$"值,因为"$$"会从父进程继承。
何时产生子shell
要解释清楚子shell以及产生何种类型的子shell,需要搞清楚Linux中如何产生子进程。Linux上创建子进程的方式有三种:一种是fork出来的进程,一种是exec出来的进程,一种是clone出来的进程。此处无需关心clone,因为它用来实现Linux中的线程。
(1).fork是复制进程,它会复制当前进程的副本(不考虑写时复制的模式),以适当的方式将这些资源交给子进程。所以子进程掌握的资源和父进程是一样的,包括内存中的内容,所以也包括环境变量和变量。但父子进程是完全独立的,它们是一个程序的两个实例。
(2).exec是加载另一个应用程序,替代当前运行的进程,也就是说在不创建新进程的情况下加载一个新程序。exec还有一个动作:在进程执行完毕后,退出exec所在的shell环境。
所以为了保证进程安全,若要形成新的且独立的子进程,都会先fork一份当前进程,然后在fork出来的子进程上调用exec来加载新程序替代该子进程。例如在bash下执行cp命令,会先fork出一个bash,然后再exec加载cp程序覆盖子bash进程变成cp进程。
再来说明子shell的问题。一般fork出来的子进程,内容和父进程是一样的(包括变量),例如执行cp命令时也能获取到父进程的变量。但是cp命令在哪里执行呢?执行cp命令敲入回车后,当前的bash进程fork出一个子bash,然后子bash通过exec加载cp程序替代子bash。这算是进入了子shell吗?更通用的问题是:什么情况下会进入子shell环境,什么时候不进入子shel环境呢?
判断是否进入了子shell的方式非常简单,执行"echo $BASHPID",如果该值和父bash进程的pid值不同,则表示进入了子shell。在shell中是否进入子shell的情况可以分为几种:
①.执行bash内置命令时。
bash内置命令是非常特殊的,父进程不会创建子进程来执行这些命令,而是直接在当前bash环境中执行。但如果将内置命令放在管道后,则此内置命令将和管道左边的进程同属于一个进程组,所以仍然会创建子shell。
[root@linuxidc ~]# echo $BASHPID # 当前BASHPID 65230 [root@linuxidc ~]# let a=$BASHPID # bash内置命令,不进入子shell [root@linuxidc ~]# echo $a 65230
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# cd | expr $BASHPID # 管道使得任何命令都进入进程组,会进入子shell 65603
②.执行bash命令本身时。
这是一个很巧合的命令。bash命令本身是bash内置命令,在当前shell环境下执行内置命令本不会创建子shell,也就是说不会有独立的bash进程出现,而实际结果则表现为新的bash是一个子进程。其中一个原因是执行bash命令会加载各种环境配置项,为了父bash的环境得到保护而不被覆盖,所以应该让其以子shell的方式存在。虽然fork出来的bash子进程内容完全继承父shell,但因重新加载了环境配置项,所以子shell没有继承普通变量,更准确的说是覆盖了从父shell中继承的变量。不妨试试在/etc/bashrc文件中定义一个变量,再在父shell中export名称相同值却不同的环境变量,然后到子shell中看看该变量的值为何?
[root@linuxidc ~]# echo "var=55" >>/etc/bashrc [root@linuxidc ~]# export var=66 [root@linuxidc ~]# bash [root@linuxidc ~]# echo $var 55
由结果55可知,执行bash时加载的/etc/bashrc中的变量覆盖了父bash中的导出的环境变量值66。
其实执行bash命令,既可以认为进入了子shell,也可以认为没有进入子shell。从bash是内置命令的角度来考虑,它不会进入子shell,这一点在执行bash命令后从变量$BASH_SUBSHELL的值为0可以验证出来。但从执行bash命令后进入了新的shell环境来看,它有其父bash进程,且$BASHPID值和父shell不同,所以它算是进入了子shell。
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# bash [root@linuxidc ~]# echo $BASHPID 65534
③.执行shell脚本时。
脚本中第一行总是"#!/bin/bash"或者直接"bash xyz.sh",这和上面的执行bash进入子shell其实是一回事,都是使用bash命令进入子shell。只不过此时的bash命令和情况②中直接执行bash命令所隐含的选项不一样,所以继承和加载的shell环境也不一样。事实也确实如此,它仅只继承父shell的某些环境变量,其余环境一概初始化。
另外,执行shell脚本相比于直接执行bash命令,还多了一个动作:脚本执行完毕后自动退出子shell。
[root@linuxidc ~]# cat b.sh #!/bin/bash echo $BASHPID [root@linuxidc ~]# echo $BASHPID 65534 [root@linuxidc ~]# ./b.sh 65570
④.执行shell函数时。
其实shell函数就是命令,它和bash内置命令的情况一样。直接执行时不会进入子shell,但放在管道后会进入子shell。
[root@linuxidc ~]# fun_test (){ echo $BASHPID; } # 定义一个函数,输出BASHPID变量的值 [root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# fun_test # 说明执行函数不会进入子shell 65230 [root@linuxidc ~]# cd | fun_test # 但放在管道后会进入子shell 65605
⑤.执行非bash内置命令时。
例如执行cp命令、grep命令等,它们直接fork一份bash进程,然后使用exec加载程序替代该子bash。此类子进程会继承所有父bash的环境。但严格地说,这已经不是子shell,因为exec加载的程序已经把子bash进程替换掉了,这意味着丢失了很多bash环境。在bash文档中,直接称呼这种环境为"单独的环境",和子shell的概念类似。
[root@linuxidc ~]# let a=$BASHPID # let是内置命令 [root@linuxidc ~]# echo $a 65230 [root@linuxidc ~]# echo $BASHPID # echo是非内置命令,结果是不进入子shell 65230
⑥.命令替换。
当命令行中包含了命令替换部分时,将开启一个子shell先执行这部分内容,再将执行结果返回给当前命令。因为这次的子shell不是通过bash命令进入的子shell,所以它会继承父shell的所有变量内容。这也就解释了"echo $(echo $$)"中"$$"的结果是当前bash的pid号,而不是子shell的pid号,但"echo $(echo $BASHPID)"却和父bash进程的pid不同,因为它不是使用bash命令进入的子shell。
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# echo $(echo $BASHPID) # 使用命令替换$()进入子shell 65612
⑦.使用括号()组合一系列命令。
例如(ls;date;echo haha),独立的括号将会开启一个子shell来执行括号内的命令。这种情况等同于情况⑤。
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# (echo $BASHPID) # 使用括号()的命令组合进入子shell 65613
⑧.放入后台运行的任务。
它不仅是一个独立的子进程,还是在子shell环境中运行的。例如"echo hahha &"。
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# echo $BASHPID & # 放入后台运行的任务进入子shell [1] 65614 [root@linuxidc ~]# 65614 [1]+ Done echo $BASHPID
⑨.进程替换。
既然是新进程了,当然进入子shell执行。例如"cat <(echo haha)"。
[root@linuxidc ~]# echo $BASHPID 65230 [root@linuxidc ~]# cat <(echo $BASHPID) # 进程替换"<()"进入子shell 65616
需要说明的是,子shell的环境设置不会粘滞到父shell环境,也就是说子shell的变量等不会影响父shell。
最后,建议同时阅读另一篇文章:bash启动时环境配置流程,此文中详细解释了bash启动时加载哪些配置文件。