Linux 技巧: Bash 测试和比较函数 (shell编程)
Bash shell 在当今的许多 Linux® 和 UNIX® 系统上都可使用,是 Linux 上常见的默认 shell。Bash 包含强大的编程功能,其中包括丰富的可测试文件类型和属性的函数,以及在多数编程语言中可以使用的算术和字符串比较函数。理解不同的测试并认识到 shell 还能把一些操作符解释成 shell 元字符,是成为高级 shell 用户的重要一步。这篇文章摘自 developerWorks 教程 LPI 102 考试准备,主题 109: Shell、脚本、编程和编译,介绍了如何理解和使用 Bash shell 的测试和比较操作。
这 个技巧解释了 shell 测试和比较函数,演示了如何向 shell 添加编程功能。您可能已经看到过使用 && 和 || 操作符的简单 shell 逻辑,它允许您根据前一条命令的退出状态(正确退出或伴随错误退出)而执行后一条命令。在这个技巧中,将看到如何把这些基本的技术扩展成更复杂的 shell 编程。
测试
在任何一种编程语言中,学习了如何给变量分配值和传递参数之后,都需要测试这些值和参数。在 shell 中,测试会设置返回的状态,这与其他命令执行的功能相同。实际上,test
是个内置命令!
test 和 [
内置命令 test
根据表达式expr 求值的结果返回 0(真)或 1(假)。也可以使用方括号:test <em>expr</em>
和 [ expr ] 是等价的。 可以用 $?
检查返回值;可以使用 && 和 || 操作返回值;也可以用本技巧后面介绍的各种条件结构测试返回值。
清单 1. 一些简单测试
[ian@pinguino ~]$ test 3 -gt 4 && echo True || echo false false [ian@pinguino ~]$ [ "abc" != "def" ];echo $? 0 [ian@pinguino ~]$ test -d "$HOME" ;echo $? 0
在清单 1 的第一个示例中,-gt
操作符对两个字符值之间执行算术比较。在第二个示例中,用 [ ]
的形式比较两个字符串不相等。在最后一个示例中,测试 HOME 变量的值,用单目操作符 -d
检查它是不是目录。
可以用 -eq
、 -ne
、-lt
、 -le
、 -gt
或 -ge
比较算术值,它们分别表示等于、不等于、小于、小于等于、大于、大于等于。
可以分别用操作符 =
、 !=
、<
和 >
比较字符串是否相等、不相等或者第一个字符串的排序在第二个字符串的前面或后面。单目操作符 -z
测试 null 字符串,如果字符串非空 -n
返回 True(或者根本没有操作符)。
说明:shell 也用 <
和 >
操作符进行重定向,所以必须用 \<
或 \>
加以转义。清单 2 显示了字符串测试的更多示例。检查它们是否如您预期的一样。
清单 2. 一些字符串测试
[ian@pinguino ~]$ test "abc" = "def" ;echo $? 1 [ian@pinguino ~]$ [ "abc" != "def" ];echo $? 0 [ian@pinguino ~]$ [ "abc" \< "def" ];echo $? 0 [ian@pinguino ~]$ [ "abc" \> "def" ];echo $? 1 [ian@pinguino ~]$ [ "abc" \<"abc" ];echo $? 1 [ian@pinguino ~]$ [ "abc" \> "abc" ];echo $? 1
表 1 显示了一些更常见的文件测试。如果被测试的文件存在,而且有指定的特征,则结果为 True。
表 1. 一些常见的文件测试-d目录-e存在(也可以用 -a)-f普通文件-h符号连接(也可以用 -L)-p命名管道-r可读-s非空-S套接字-w可写-N从上次读取之后已经做过修改除了上面的单目测试,还可以使用表 2 所示的双目操作符比较两个文件:
表 2. 测试一对文件-nt测试 file1 是否比 file2 更新。修改日期将用于这次和下次比较。-ot测试 file1 是否比 file2 旧。-ef测试 file1 是不是 file2 的硬链接。其他一些测试可以用来测试文件许可之类的内容。请参阅 bash 手册获得更多细节或使用 help test
查看内置测试的简要信息。也可以用 help
命令了解其他内置命令。
-o
操作符允许测试利用 set -o <em>选项</em>
设置的各种 shell 选项,如果设置了该选项,则返回 True (0),否则返回 False (1),如清单 3 所示。
清单 3. 测试 shell 选项
[ian@pinguino ~]$ set +o nounset [ian@pinguino ~]$ [ -o nounset ];echo $? 1 [ian@pinguino ~]$ set -u [ian@pinguino ~]$ test -o nounset; echo $? 0
最后,-a
和 -o
选项允许使用逻辑运算符 AND 和 OR 将表达式组合在一起。单目操作符 !
可以使测试的意义相反。可以用括号把表达式分组,覆盖默认的优先级。请记住 shell 通常要在子 shell 中运行括号中的表达式,所以需要用 \( 和 \) 转义括号,或者把这些操作符括在单引号或双引号内。清单 4 演示了摩根法则在表达式上的应用。
清单 4. 组合和分组测试
[ian@pinguino ~]$ test "a" != "$HOME" -a 3 -ge 4 ; echo $? 1 [ian@pinguino ~]$ [ ! \( "a" = "$HOME" -o 3 -lt 4 \) ]; echo $? 1 [ian@pinguino ~]$ [ ! \( "a" = "$HOME" -o '(' 3 -lt 4 ')' ")" ]; echo $? 1
(( 和 [[
test
命令非常强大,但是很难满足其转义需求以及字符串和算术比较之间的区别。幸运的是,bash 提供了其他两种测试方式,这两种方式对熟悉 C、C++ 或 Java® 语法的人来说会更自然些。
(( ))
复合命令 计算算术表达式,如果表达式求值为 0,则设置退出状态为 1;如果求值为非 0 值,则设置为 0。不需要对 ((
和 ))
之间的操作符转义。算术只对整数进行。除 0 会产生错误,但不会产生溢出。可以执行 C 语言中常见的算术、逻辑和位操作。 let
命令也能执行一个或多个算术表达式。它通常用来为算术变量分配值。
清单 5. 分配和测试算术表达式
[ian@pinguino ~]$ let x=2 y=2**3 z=y*3;echo $? $x $y $z 0 2 8 24 [ian@pinguino ~]$ (( w=(y/x) + ( (~ ++x) & 0x0f ) )); echo $? $x $y $w 0 3 8 16 [ian@pinguino ~]$ (( w=(y/x) + ( (~ ++x) & 0x0f ) )); echo $? $x $y $w 0 4 8 13
同使用 (( ))
一样,利用复合命令 [[ ]]
可以对文件名和字符串使用更自然的语法。可以用括号和逻辑操作符把 test
命令支持的测试组合起来。
清单 6. 使用 [[ 复合命令
[ian@pinguino ~]$ [[ ( -d "$HOME" ) && ( -w "$HOME" ) ]] && > echo "home is a writable directory" home is a writable directory
在使用 =
或 !=
操作符时,复合命令 [[
还能在字符串上进行模式匹配。匹配的方式就像清单 7 所示的通配符匹配。
清单 7. 用 [[ 进行通配符测试
[ian@pinguino ~]$ [[ "abc def .d,x--" == a[abc]*\ ?d* ]]; echo $? 0 [ian@pinguino ~]$ [[ "abc def c" == a[abc]*\ ?d* ]]; echo $? 1 [ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* ]]; echo $? 1
甚至还可以在 [[
复合命令内执行算术测试,但是千万要小心。除非在 ((
复合命令内,否则 <
和 >
操作符会把操作数当成字符串比较并在当前排序序列中测试它们的顺序。清单 8 用一些示例演示了这一点。
清单 8. 用 [[ 包含算术测试
[ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* || (( 3 > 2 )) ]]; echo $? 0 [ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* || 3 -gt 2 ]]; echo $? 0 [ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* || 3 > 2 ]]; echo $? 0 [ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* || a > 2 ]]; echo $? 0 [ian@pinguino ~]$ [[ "abc def d,x" == a[abc]*\ ?d* || a -gt 2 ]]; echo $? -bash: a: unbound variable
条件测试
虽然使用以上的测试和 &&
、 ||
控制操作符能实现许多编程,但 bash 还包含了更熟悉的 “if, then, else” 和 case 结构。学习完这些之后,将学习循环结构,这样您的工具箱将真正得到扩展。
If、then、else 语句
bash 的 if
命令是个复合命令,它测试一个测试或命令($?
)的返回值,并根据返回值为 True(0)或 False(不为 0)进行分支。虽然上面的测试只返回 0 或 1 值,但命令可能返回其他值。请参阅 LPI 102 考试准备,主题 109: Shell、脚本、编程和编译 教程学习这方面的更多内容。
Bash 中的 if
命令有一个 then
子句,子句中包含测试或命令返回 0 时要执行的命令列表,可以有一个或多个可选的 elif
子句,每个子句可执行附加的测试和一个 then
子句,子句中又带有相关的命令列表,最后是可选的 else
子句及命令列表,在前面的测试或 elif
子句中的所有测试都不为真的时候执行,最后使用 fi
标记表示该结构结束。
使用迄今为止学到的东西,现在能够构建简单的计算器来计算算术表达式,如清单 9 所示:
清单 9. 用 if、then、else 计算表达式
[ian@pinguino ~]$ function mycalc () > { > local x > if [ $# -lt 1 ]; then > echo "This function evaluates arithmetic for you if you give it some" > elif (( $* )); then > let x="$*" > echo "$* = $x" > else > echo "$* = 0 or is not an arithmetic expression" > fi > } [ian@pinguino ~]$ mycalc 3 + 4 3 + 4 = 7 [ian@pinguino ~]$ mycalc 3 + 4**3 3 + 4**3 = 67 [ian@pinguino ~]$ mycalc 3 + (4**3 /2) -bash: syntax error near unexpected token `(' [ian@pinguino ~]$ mycalc 3 + "(4**3 /2)" 3 + (4**3 /2) = 35 [ian@pinguino ~]$ mycalc xyz xyz = 0 or is not an arithmetic expression [ian@pinguino ~]$ mycalc xyz + 3 + "(4**3 /2)" + abc xyz + 3 + (4**3 /2) + abc = 35
这个计算器利用 local
语句将 x 声明为局部变量,只能在 mycalc
函数的范围内使用。let
函数具有几个可用的选项,可以执行与它密切关联的 declare
函数。请参考 bash 手册或使用 help let
获得更多信息。
如清单 9 所示,需要确保在表达式使用 shell 元字符 —— 例如(、)、*、> 和 < 时 —— 正确地对表达式转义。无论如何,现在有了一个非常方便的小计算器,可以像 shell 那样进行算术计算。
在清单 9 中可能注意到 else
子句和最后的两个示例。可以看到,把 xyz
传递给 mycalc 并没有错误,但计算结果为 0。这个函数还不够灵巧,不能区分最后使用的示例中的字符值,所以不能警告用户。可以使用字符串模式匹配测试(例如 [[ ! ("$*" == *[a-zA-Z]* ]]
,或使用适合自己范围的形式)消除包含字母表字符的表达式,但是这会妨碍在输入中使用 16 进制标记,因为使用 16 进制标记时可能要用 0x0f 表示 15。实际上,shell 允许的基数最高为 64(使用 <em>base</em>#<em>value</em>
标记),所以可以在输入中加入 _ 和 @ 合法地使用任何字母表字符。8 进制和 16 进制使用常用的标记方式,开头为 0 表示八进制,开头为 0x 或 0X 表示 16 进制。清单 10 显示了一些示例。
清单 10. 用不同的基数进行计算
[ian@pinguino ~]$ mycalc 015 015 = 13 [ian@pinguino ~]$ mycalc 0xff 0xff = 255 [ian@pinguino ~]$ mycalc 29#37 29#37 = 94 [ian@pinguino ~]$ mycalc 64#1az 64#1az = 4771 [ian@pinguino ~]$ mycalc 64#1azA 64#1azA = 305380 [ian@pinguino ~]$ mycalc 64#1azA_@ 64#1azA_@ = 1250840574 [ian@pinguino ~]$ mycalc 64#1az*64**3 + 64#A_@ 64#1az*64**3 + 64#A_@ = 1250840574
对输入进行的额外处理超出了本技巧的范围,所以请小心使用这个计算器。
elif
语句非常方便。它允许简化缩进,从而有助于脚本编写。在清单 11 中可能会对 type
命令在 mycalc
函数中的输出感到惊讶。
清单 11. Type mycalc
[ian@pinguino ~]$ type mycalc mycalc is a function mycalc () { local x; if [ $# -lt 1 ]; then echo "This function evaluates arithmetic for you if you give it some"; else if (( $* )); then let x="$*"; echo "$* = $x"; else echo "$* = 0 or is not an arithmetic expression"; fi; fi }
当然,也可以只用 $(( <em>表达式</em> ))
和 echo
命令进行 shell 算术运算,如清单 12 所示。这样就不必学习关于函数或测试的任何内容,但是请注意 shell 不会解释元字符,例如 *,因此元字符不能在 (( <em>表达式</em> ))
或 [[ <em>表达式</em> ]]
中那样正常发挥作用。
清单 12. 在 shell 中用 echo 和 $(( )) 直接进行计算
[ian@pinguino ~]$ echo $((3 + (4**3 /2))) 35
结束语
如果想了解在 Linux 中进行 Bash 脚本编程的更多内容,请阅读本文所属的教程 “LPI 102 考试准备,主题 109: Shell、脚本、编程和编译”,或查看下面的其他 参考资料。请不要忘记 给本页打分。
参考资料
学习
- 您可以参阅本文在 developerWorks 全球网站上的 英文原文。
- 请参阅教程 “LPI 102 考试准备,主题 109: Shell、脚本、编程和编译”(developerWorks,2007 年 1 月)获得在 Linux 上进行 Bash shell 定制和脚本编程的更多信息。它是大型 LPI exam prep tutorial 系列 的一部分,介绍了 Linux 基础原理以及通过系统管理员认证所需的知识。
- 请阅读 developerWorks 的文章了解使用 Bash 的其他方式:
- “Shell Command Language” 定义了开放组织和 IEEE 规定的 shell 命令语言。
- 可以在 developerWorks 中国网站 Linux 专区 找到更多 面向 Linux 开发人员的教程。
- 随时关注 developerWorks 技术活动 和 网络广播。
获得产品和技术
- 请订购 SEK for Linux,共有两张 DVD,包含最新的用于 Linux 的 IBM 试用软件,包括 DB2®、Lotus®、Rational®、Tivoli® 和 WebSphere®。
- 可以直接从 developerWorks 下载 IBM 试用软件。
讨论
- 参与论坛讨论。
- 请阅读 developerWorks blogs,加入 developerWorks 社区。
来源:http://www.ibm.com/developerworks/cn/linux/l-bash-test.html