在使用Unix系统的过程中,可能大家会遇到如下这些问题:
1、在Unix系统下需要编译一个比较大的程序,估计要20分钟。在编译过程中可能会出现一些警告或者错误信息。系统工程师不可能这二十分钟都盯着屏幕看。为此系统工程师希望shell能够把这这些编译过程中出现的警告或者错误信息能够保存在一个文件中,以供系统工程师或者程序开发人员后续查询所用。
2、在开发程序的时,有时候是根据代码的行数来收费的,在Unix系统中开发应用程序也是如此。为此系统工程师也希望能够有工具能够方便的来统计某个程序文件的行数。
3、有时候系统管理员可能希望能够把几个文本文件合并起来。虽然通过复制、粘贴可以实现类似的功能。但是当需要被合并的文件比较多的时候,通过赋值粘贴来实现合并的目的,并不是很好的处理方法。等等。
以上这些问题虽然在Unix系统中没有专门的命令来解决。但是通过重定向功能,再结合其他的一些处理技巧,这些问题就迎刃而解了。
一、利用重定向功能实现文件的合并。
在Unix系统中,当要把多个文件合并为一个文件时,重定向功能就会显得特别有用。如现在系统管理员希望帮Unix系统中的A1.TXT、A2.TXT 文件合并(甚至多个文件)就可以通过重定向功能来实现。在谈具体的原理之前,笔者先把这个命令写出来。
Cat A1.TXT、A2.TXT > new.txt
这个命令的具体执行过程如下:
首先当shell发现命令行中有特殊字符时,就会把流从它的默认设备上断开。现在这个命令中有>符号时,系统就会创建一个新的文件new.txt为写入做准备。不过这里要注意一个问题,如果此时Unix系统中已经存在了这个文件,则shell会覆盖这个文件,而不会给系统管理员任何的提示。所以在利用输出重定向功能的时候,一定要谨慎。特别是最好不要以root身份来运行这个命令。因为特权用户对于系统中的所有文件与目录都有完全控制的权限。为此其运行这个命令的话,万一这个文件已经存在,则会毫不犹豫的覆盖这个文件,即使这个文件的所有者不是特权用户。
其次shell会断开默认设备。Cat命令的默认设备通常情况下就是屏幕终端。但是shell在解释命令的时候看到了命令中有特殊符号,故会断开其默认设备,而会连接到new.txt这个文件中。即把这个文件当作其默认的显示设备。注意这里是断开默认设备,连接一个新设备;而不是创建一个备份设备。也就是说,此时执行这个命令的时候,因为已经断开了与屏幕终端的连接,故这两个文件的内容不会在屏幕上显示,而直接保存到了new.txt文件中。
第三cat命令打开依次打开文件并读取数据。这里系统管理员需要弄清楚一个问题,是shell打开了这两个文件呢还是命令cat打开了这两个文件?搞清楚这个问题的答案对于后续的学习很有帮助。笔者在后续的文章中会谈到这个问题。在这里系统管理员只需要记住,执行这个命令的时候是cat命令打开了这些文件,而不是shell。然后Cat命令会把读取的数据写入到已经重定向到new.txt文件的标准输出。
注意在这个命令的执行过程中,Cat命令并不知道它实际上是把内容写入到了一个新的文件中。也就是说,任何使用标准输出的命令都不知道它输出的目标对象。他们总认为他们是在向默认设备中输出。
不过利用上面这个命令来合并文件的时候,还有一个小小的缺陷。即上面的输出流合并的过程中并没有显示合并的文件名。而系统管理员可能希望在new.txt文件的开头能够显示合并的文件名字,以提高文件的阅读性。要实现这个功能也很简单。假如现在在当前目录下有以A开头的、.txt结尾的文件五个,系统管理员希望能够把他们合并起来,并在新文件的开头显示这五个文件的名字,此时就可以通过如下的命令来实现。
(ls –x A*.txt;echo;cat A*.txt)> new.txt
这个命令中ls表示列出所有需要合并文件的名字,通过重定向符号会把这个结果写入到合并后的文件中。而这个命令中的echo命令是为了在表头列于C语言代码之间插入一空行。也就是说,执行这个命令后程序文件名将显示在表头列里,这样代码列表清单的最前面就好像建立了一个目录一样。
笔者最后再强调一次,在使用标准输出重定向功能的时候,当一个命令的输出被重定向到一个文件时,这个输出文件由shell在命令执行前创建。如果输出文件不存在,则shell 会在命令执行前自动创建它;如果输出文件已经存在,则shell会覆盖这个已经存的文件。为此在使用这个功能的时候,最好能够通过ls等命令查看这个文件是否存在,以免因为误操作而给用户带来不必要的损失。