透过 shell 看世界
- 8.1 (字符)扩展
  - 8.1.1 路径名扩展
  - 8.1.2 波浪线扩展
  - 8.1.3 算术表达式扩展
  - 7.1.4 花括号扩展
  - 8.1.5 参数扩展
  - 8.1.6 命令替换
- 8.2 引用
  - 8.2.1 双引号
  - 8.2.2 单引号
  - 8.2.3 转义字符
- 8.3 总结归纳
- 拓展阅读

透过 shell 看世界

在这一章我们将看到，当你按下 enter 键后，发生在命令行中的一些“魔法”。尽管我们会深入研究几个复杂而有趣的 shell 特性，但我们只需要使用一个新命令：

echo －显示一行文本

8.1 (字符)扩展

每当你输入一个命令并按下 enter 键，bash 会在执行你的命令之前对输入的字符完成几个步骤的处理。我们已经见过几个例子：例如一个简单的字符序列”*“,对 shell 来说有着多么丰富的涵义。这背后的的过程叫做（字符）展开。通过展开，你输入的字符，在 shell 对它起作用之前，会展开成为别的字符。为了说明这一点，让我们看一看 echo 命令。echo 是一个 shell 内建命令，可以完成非常简单的任务。它将它的文本参数打印到标准输出中。

[me@linuxbox ~]$ echo this is a test
this is a test

这个命令的作用相当简单明了。传递到 echo 命令的任一个参数都会在（屏幕上）显示出来。让我们试试另一个例子：

[me@linuxbox ~]$ echo *
Desktop Documents ls-output.txt Music Pictures Public Templates Videos

那么刚才发生了什么事情呢？为什么 echo 不打印”*“呢？如果你回忆起我们所学过的关于通配符的内容，这个”*“字符意味着匹配文件名中的任意字符，但在原先的讨论中我们并不知道 shell 是怎样实现这个功能的。简单的答案就是 shell 在 echo 命令被执行前把”*“展开成了另外的东西（在这里，就是在当前工作目录下的文件名字）。当回车键被按下时，shell 在命令被执行前在命令行上自动展开任何符合条件的字符，所以 echo 命令的实际参数并不是”*“，而是它展开后的结果。知道了这个以后，我们就能明白 echo 的行为符合预期。

8.1.1 路径名扩展

通配符所依赖的工作机制叫做路径名展开。如果我们试一下在之前的章节中使用的技巧，我们会看到它们实际上是展开。给定一个家目录，它看起来像这样：

[me@linuxbox ~]$ ls
Desktop   ls-output.txt   Pictures   Templates
....

我们能够执行以下的展开：

[me@linuxbox ~]$ echo D*
Desktop  Documents

和：

[me@linuxbox ~]$ echo *s
Documents Pictures Templates Videos

甚至是：

[me@linuxbox ~]$ echo [[:upper:]]*
Desktop Documents Music Pictures Public Templates Videos

[me@linuxbox ~]$ echo /usr/*/share
/usr/kerberos/share  /usr/local/share

隐藏文件路径名展开

正如我们知道的，以圆点字符开头的文件名是隐藏文件。路径名展开也尊重这种行为。像这样的展开：echo * 不会显示隐藏文件

直觉告诉我们，如果展开模式以一个圆点开头，我们就能够在展开中包含隐藏文件，就像这样：

echo .*

它几乎要起作用了。然而，如果我们仔细检查一下输出结果，我们会看到名字”.”和”..”也出现在结果中。由于它们是指当前工作目录和父目录，使用这种模式可能会产生不正确的结果。我们可以通过这个命令来验证：

ls -d .* | less

为了在这种情况下正确地完成路径名展开，我们应该使用一个更精确的模式。这个模式会正确地工作：

ls -d .[!.]?*

这种模式展开成所有以圆点开头，第二个字符不包含圆点，再包含至少一个字符，并且这个字符之后紧接着任意多个字符的文件名。这个命令将正确列出大多数的隐藏文件（但仍不能包含以多个圆点开头的文件名）。带有 -A 选项（“几乎所有”）的 ls 命令能够提供一份正确的隐藏文件清单：

ls -A

8.1.2 波浪线扩展

可能你从我们对 cd 命令的介绍中回想起来，波浪线字符(“~”)有特殊的含义。当它用在一个单词的开头时，它会展开成指定用户的家目录名，如果没有指定用户名，则展开成当前用户的家目录：

[me@linuxbox ~]$ echo ~
/home/me

如果有用户”foo”这个帐号，那么：

[me@linuxbox ~]$ echo ~foo
/home/foo

8.1.3 算术表达式扩展

shell 在展开中执行算数表达式。这允许我们把 shell 提示当作计算器来使用：

[me@linuxbox ~]$ echo $((2 + 2))
4

算术表达式展开使用这种格式：

$((expression))

（以上括号中的）表达式是指算术表达式，它由数值和算术操作符组成。

算术表达式只支持整数（全部是数字，不带小数点），但是能执行很多不同的操作。这里是一些它支持的操作符：

运算符	描述（说明）
+	加
-	减
*	乘
/	除（但是记住，因为展开只是支持整数除法，所以结果是整数。）
%	取余，只是简单的意味着，“余数”
**	取幂

在算术表达式中空格并不重要，并且表达式可以嵌套。例如，5的平方乘以3：

[me@linuxbox ~]$ echo $(($((5**2)) * 3))
75

一对括号可以用来把多个子表达式括起来。通过这个技术，我们可以重写上面的例子，同时用一个展开代替两个，来得到一样的结果：

[me@linuxbox ~]$ echo $(((5**2) * 3))
75

这是一个使用除法和取余操作符的例子。注意整数除法的结果：

[me@linuxbox ~]$ echo Five divided by two equals $((5/2))
Five divided by two equals 2
[me@linuxbox ~]$ echo with $((5%2)) left over.
with 1 left over.

在35章会更深入地讨论算术表达式的内容。

7.1.4 花括号扩展

可能最奇怪的展开是花括号展开。通过它，你可以从一个包含花括号的模式中创建多个文本字符串。这是一个例子：

[me@linuxbox ~]$ echo Front-{A,B,C}-Back
Front-A-Back Front-B-Back Front-C-Back

花括号展开模式可能包含一个开头部分叫做报头，一个结尾部分叫做附言。花括号表达式本身可能包含一个由逗号分开的字符串列表，或者一系列的整数，或者单个的字符串。这种模式不能嵌入空白字符。这个例题使用了一系列整数：

[me@linuxbox ~]$ echo Number_{1..5}
Number_1  Number_2  Number_3  Number_4  Number_5

一系列以倒序排列的字母：

[me@linuxbox ~]$ echo {Z..A}
Z Y X W V U T S R Q P O N M L K J I H G F E D C B A

花括号展开可以嵌套：

[me@linuxbox ~]$ echo a{A{1,2},B{3,4}}b
aA1b aA2b aB3b aB4b

那么这对什么有好处呢？最常见的应用是，创建一系列的文件或目录列表。例如，如果我们是摄影师，有大量的相片。我们想把这些相片按年月先后组织起来。首先，我们要创建一系列以数值”年－月”形式命名的目录。通过这种方式，可以使目录名按照年代顺序排列。我们可以手动键入整个目录列表，但是工作量太大了，并且易于出错。反之，我们可以这样做：

[me@linuxbox ~]$ mkdir Pics
[me@linuxbox ~]$ cd Pics
[me@linuxbox Pics]$ mkdir {2007..2009}-0{1..9} {2007..2009}-{10..12}
[me@linuxbox Pics]$ ls
2007-01 2007-07 2008-01 2008-07 2009-01 2009-07
2007-02 2007-08 2008-02 2008-08 2009-02 2009-08
2007-03 2007-09 2008-03 2008-09 2009-03 2009-09
2007-04 2007-10 2008-04 2008-10 2009-04 2009-10
2007-05 2007-11 2008-05 2008-11 2009-05 2009-11
2007-06 2007-12 2008-06 2008-12 2009-06 2009-12

棒极了！

8.1.5 参数扩展

在这一章我们将会简单介绍参数展开，但会在后续章节中进行详细讨论。这个特性在 shell 脚本中比直接在命令行中更有用。它的许多功能和系统存储小块数据，并给每块数据命名的能力有关系。许多像这样的小块数据，更恰当的称呼应该是变量，可供你方便地检查它们。例如，叫做”USER”的变量包含你的用户名。可以这样做来调用参数，并查看 USER 中的内容，：

[me@linuxbox ~]$ echo $USER
me

要查看有效的变量列表，可以试试这个：

[me@linuxbox ~]$ printenv | less

你可能注意到在其它展开类型中，如果你误输入一个模式，展开就不会发生。这时 echo 命令只简单地显示误键入的模式。但在参数展开中，如果你拼写错了一个变量名，展开仍然会进行，只是展开的结果是一个空字符串：

[me@linuxbox ~]$ echo $SUER
[me@linuxbox ~]$

8.1.6 命令替换

命令替换允许我们把一个命令的输出作为一个展开模式来使用：

[me@linuxbox ~]$ echo $(ls)
Desktop Documents ls-output.txt Music Pictures Public Templates
Videos

我最喜欢用的一行命令是像这样的：

[me@linuxbox ~]$ ls -l $(which cp)
-rwxr-xr-x 1 root root 71516 2007-12-05 08:58 /bin/cp

这里我们把 which cp 的执行结果作为一个参数传递给 ls 命令，因此可以在不知道 cp 命令完整路径名的情况下得到它的文件属性列表。我们不只限制于简单命令。也可以使用整个管道线（只展示部分输出）：

[me@linuxbox ~]$ file $(ls /usr/bin/* | grep zip)
/usr/bin/bunzip2:     symbolic link to `bzip2'
....

在这个例子中，管道线的输出结果成为 file 命令的参数列表。

在旧版 shell 程序中，有另一种语法也支持命令替换，可与刚提到的语法轮换使用。
bash 也支持这种语法。它使用倒引号来代替美元符号和括号：

[me@linuxbox ~]$ ls -l `which cp`
-rwxr-xr-x 1 root root 71516 2007-12-05 08:58 /bin/cp

8.2 引用

我们已经知道 shell 有许多方式可以完成展开，现在是时候学习怎样来控制展开了。以下面例子来说明：

[me@linuxbox ~]$ echo this is a    test
this is a test

或者：

[me@linuxbox ~]$ echo The total is $100.00
The total is 00.00

在第一个例子中，shell 利用单词分割删除掉 echo 命令的参数列表中多余的空格。在第二个例子中，参数展开把 $1 的值替换为一个空字符串，因为 1 是没有定义的变量。shell 提供了一种叫做引用的机制，来有选择地禁止不需要的展开。

8.2.1 双引号

我们将要看一下引用的第一种类型，双引号。如果你把文本放在双引号中，shell 使用的特殊字符，都失去它们的特殊含义，被当作普通字符来看待。有几个例外： $，\ (反斜杠），和 `（倒引号）。这意味着单词分割、路径名展开、波浪线展开和花括号展开都将失效，然而参数展开、算术展开和命令替换仍然执行。使用双引号，我们可以处理包含空格的文件名。比方说我们是不幸的名为 two words.txt 文件的受害者。如果我们试图在命令行中使用这个文件，单词分割机制会导致这个文件名被看作两个独自的参数，而不是所期望的单个参数：

[me@linuxbox ~]$ ls -l two words.txt
ls: cannot access two: No such file or directory
ls: cannot access words.txt: No such file or directory

使用双引号，我们可以阻止单词分割，得到期望的结果；进一步，我们甚至可以修复破损的文件名。

[me@linuxbox ~]$ ls -l "two words.txt"
-rw-rw-r-- 1 me   me   18 2008-02-20 13:03 two words.txt
[me@linuxbox ~]$ mv "two words.txt" two_words.txt

你瞧！现在我们不必一直输入那些讨厌的双引号了。

记住，在双引号中，参数展开、算术表达式展开和命令替换仍然有效：

[me@linuxbox ~]$ echo "$USER $((2+2)) $(cal)"
me 4    February 2008
Su Mo Tu We Th Fr Sa
....

我们应该花费一点时间来看一下双引号在命令替换中的效果。首先仔细研究一下单词分割是怎样工作的。在之前的范例中，我们已经看到单词分割机制是怎样来删除文本中额外空格的：

[me@linuxbox ~]$ echo this is a   test
this is a test

在默认情况下，单词分割机制会在单词中寻找空格，制表符，和换行符，并把它们看作单词之间的界定符。这意味着无引用的空格，制表符和换行符都不是文本的一部分，它们只作为分隔符使用。由于它们把单词分为不同的参数，所以在上面的例子中，命令行包含一个带有四个不同参数的命令。如果我们加上双引号：

[me@linuxbox ~]$ echo "this is a    test"
this is a    test

单词分割被禁止，内嵌的空格也不会被当作界定符，它们成为参数的一部分。一旦加上双引号，我们的命令行就包含一个带有一个参数的命令。

事实上，单词分割机制把换行符看作界定符，对命令替换产生了一个虽然微妙但有趣的影响。考虑下面的例子：

[me@linuxbox ~]$ echo $(cal)
February 2008 Su Mo Tu We Th Fr Sa 1 2 3 4 5 6 7 8 9 10 11 12 13 14
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
[me@linuxbox ~]$ echo "$(cal)"
February 2008
....

在第一个实例中，没有引用的命令替换导致命令行包含38个参数。在第二个例子中，命令行只有一个参数，参数中包括嵌入的空格和换行符。

8.2.2 单引号

如果需要禁止所有的展开，我们要使用单引号。以下例子是无引用，双引号，和单引号的比较结果：

[me@linuxbox ~]$ echo text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER
text /home/me/ls-output.txt a b foo 4 me
[me@linuxbox ~]$ echo "text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER"
text ~/*.txt   {a,b} foo 4 me
[me@linuxbox ~]$ echo 'text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER'
text ~/*.txt  {a,b} $(echo foo) $((2+2)) $USER

正如我们所看到的，随着引用程度加强，越来越多的展开被禁止。

8.2.3 转义字符

有时候我们只想引用单个字符。我们可以在字符之前加上一个反斜杠，在这里叫做转义字符。经常在双引号中使用转义字符，来有选择地阻止展开。

[me@linuxbox ~]$ echo "The balance for user $USER is: \$5.00"
The balance for user me is: $5.00

使用转义字符来消除文件名中一个字符的特殊含义，是很普遍的。例如，在文件名中可能使用一些对于 shell 来说有特殊含义的字符。这些字符包括”$”, “!”, “ “等字符。在文件名中包含特殊字符，你可以这样做：

[me@linuxbox ~]$ mv bad\&filename good_filename

为了允许反斜杠字符出现，输入”\“来转义。注意在单引号中，反斜杠失去它的特殊含义，它被看作普通字符。

反斜杠转义字符序列

反斜杠除了作为转义字符外，也可以构成一种表示法，来代表某种特殊字符，这些特殊字符叫做控制码。ASCII 编码表中前32个字符被用来把命令转输到电报机之类的设备。一些编码是众所周知的（制表符，退格符，换行符，和回车符），而其它一些编码就不熟悉了（空值，传输结束码，和确认）。

转义序列含义

\a 响铃（”警告”－导致计算机嘟嘟响）

\b 退格符

\n 新的一行。在类 Unix 系统中，产生换行

\r 回车符

\t 制表符

上表列出了一些常见的反斜杠转义字符序列。这种利用反斜杠的表示法背后的思想来源于 C 编程语言，许多其它语言也采用了这种表示方法，包括 shell。

echo 命令带上 ‘-e’ 选项，能够解释转义序列。你可以把转义序列放在 $\’ \’ 里面。以下例子中，我们可以使用 sleep 命令创建一个简单的倒数计数器（ sleep 是一个简单的程序，它会等待指定的秒数，然后退出）：

sleep 10; echo -e \”Time\’s up\a\”

我们也可以这样做：

sleep 10; echo \”Time\’s up\” $\’\a\’

转义序列	含义
\a	响铃（”警告”－导致计算机嘟嘟响）
\b	退格符
\n	新的一行。在类 Unix 系统中，产生换行
\r	回车符
\t	制表符

8.3 总结归纳

随着我们继续学习 shell，你会发现使用展开和引用的频率逐渐多起来，所以能够很好的理解它们的工作方式很有意义。事实上，可以这样说，它们是学习 shell 的最重要的主题。如果没有准确地理解展开模式，shell 总是神秘和混乱的源泉，并且 shell 潜在的能力也浪费掉了。

拓展阅读

Bash 手册页有主要段落是关于展开和引用的，它们以更正式的方式介绍了这些题目。
Bash 参考手册也包含章节，介绍展开和引用：
http://www.gnu.org/software/bash/manual/bashref.html

第八章：从 shell 眼中看世界