📄 00000019.htm
字号:
expect还支持许多更复杂的进程控制方式,如fork,disconnect等等,你可以从手册 <BR>页面中得到详细的信息。另外,各种tcl运算符和流程控制命令,包括tcl函数也可以使 <BR>用。 <BR> <BR> 有些读者可能会问,如果expect执行的话是否控制台输入不能使用了,答案是否定的 <BR>。expect命令运行时,如果某个等待的信息没有得到,那么程序会阻塞在相应的expect <BR>语句处,这时,你在键盘上输入的东西仍然可以正常地传递到程序中去,其实对于那些 <BR>expect处理的信息,原则上你输入的内容仍然有效,只是expect的反映太快,总是抢在 <BR>你的前面“输入”就是了。知道了这一点之后,你就可能写一个expect脚本,让expect <BR>自动处理来自fscki的那些恶心的yes/no选项(我们介绍过,这些yes/no其实完全是多余 <BR>的,正常情况下你除了选择yes之外什么也干不了)。 <BR> <BR> 缺省下,expect在标准输出(你的终端上)输出所有来自应用程序的回应信息,你可 <BR>以用下面的两个命令重定向这些信息: <BR> <BR> log_file [文件名] <BR> <BR> 这个命令让expect在你设置的文件中记录输出信息。必须注意,这个选项并不影响控 <BR>制台输出信息,不过如果你通过crond设置expect脚本在半夜运行的话,你就确实可能需 <BR>要这个命令来记录各种信息了。例如: <BR> <BR> log_file expect.log <BR> <BR> log_user 0/1 <BR> <BR> 这个选项设置是否显示输出信息,设置为1时是缺省值,为0 的话,expect将不产生任 <BR>何输出信息,或者说简单地过滤掉控制台输出。必须记住,如果你用log_user 0关闭了 <BR>控制台输出,那么你同时也就关闭了对记录文件的输出。 <BR> <BR> 这一点很让人困扰,如果你确实想要记录expect的输出却不想让它在控制台上制造垃 <BR>圾的话,你可以简单地把expect的输出重定向到/dev/null: <BR> <BR> ./test.exp > /dev/null <BR> <BR> 你可以象下面这样使用一对fork和disconnect命令。expect的disconnect命令将使得 <BR>相应的进程到后台执行,输入和输出被重定向到/dev/null: <BR> <BR> if [fork]!=0 exit <BR> <BR> disconnect <BR> <BR> fork命令会产生出一个子进程,而且它产生返回值,如果返回的是0,说明这是一个子 <BR>进程,如果不为0,那么是父进程。因此,执行了fork命令之后,父进程死亡而子进程被 <BR>disconnect命令放到后台执行。注意disconnect命令只能对子进程使用。 <BR> <BR> 11.2 awk和文件的处理 <BR> <BR> UNIX里面充斥着各种记录文件和类似的东西。对文本文件的处理是系统管理员每天重 <BR>要的工作,例如从系统记录中查找重要的内容,或者对某种程序的输出进行统计等等。 <BR>我们将介绍常用的一个处理程序,即gawk。 <BR> <BR> 11.2.1 grep和正则表达式 <BR> <BR> 让我们首先从grep命令开始。这个命令大家应该很熟悉了,它用来在文件中查找一个 <BR>字符串。不过,实际上,grep的处理功能要强大和复杂的多。 <BR> <BR> grep 命令的语法是 <BR> <BR> grep [模式] [文件名] <BR> <BR> 如果没有给出文件名,就缺省使用标准输入。grep每次读取一行,并且和给出的模式 <BR>进行匹配,如果成功就把这一行会显,例如:(粗体的是我们输入的内容) <BR> <BR> $ grep test <BR> <BR> close <BR> <BR> test my hand <BR> <BR> test my hand <BR> <BR> <BR> grep的“模式”也称为正则表达式,可以由各种基本的正则表达式元素构成。正则表 <BR>达式元素主要包括下面几种: <BR> <BR> 字符串 匹配任何字符串,例如grep test表示在标准输入中1 <BR> <BR> [...] 封闭集中匹配一个字符,如:[abcde]可以匹配a,b,c,d,e <BR> <BR> [^...] 求补集中匹配一个字符,例如[^ABC]匹配 <BR> <BR> . 匹配任意字符 <BR> <BR> \s 空白符 <BR> <BR> \S 非空白符 <BR> <BR> \d 数字 <BR> <BR> \D 非数字 <BR> <BR> \w 字母或数字 <BR> <BR> \W 非字母和数字 <BR> <BR> * 匹配任何字符 <BR> <BR> 上面的形式是grep中使用的基本正则表达式,另外,还可以使用egrep,egrep是grep <BR>的一个扩展版本,支持下面这些扩展的正则字符串: <BR> <BR> ^ 匹配一行的开始 <BR> <BR> $ 匹配一行的结尾 <BR> <BR> ( ) 确定正则表达式求值顺序,和正常演算中的括号意思差不多。 <BR> <BR> (...|...|...) 或,可选项之一进行匹配,例如:(abc|dev|ghi)可以匹配abc,dev,gh <BR>i,而(ww|gg)do可以匹配wwdo或者ggdo。 <BR> <BR> + 一次或多次模式 <BR> <BR> 如:aba+匹配aba,abaa...不匹配ab <BR> <BR> 通常,我们有两种方法使用grep和egrep,一种是使用管道,例如我们应该熟悉的ps <BR>ax |grep sendmail,另一种是直接在文件中搜索对应的字符串。 <BR> <BR> grep/egrep还可以在命令行使用开关,常用的开关包括: <BR> <BR> -b 在行前加上块号 <BR> <BR> -c 统计匹配行的个数 <BR> <BR> -n 在行前加上行号 <BR> <BR> -w 将模式解释为字符串,所有正则表达式的控制命令失效 <BR> <BR> -x 精确匹配 <BR> <BR> -r 查询文件时包含子目录 <BR> <BR> 举个例子来说,我们想在/var/log/httpd/access_log中查询所有不是来自本地(192 <BR>.168.0.1)的请求记录,可以执行: <BR> <BR> grep –v "^192.168.0.1" /var/log/httpd/access_log <BR> <BR> ^用来让grep 只在行首匹配。 <BR> <BR> 在grep查询的时候可以使用通配符代表多个文件,例如,grep start * -r将在当前目 <BR>录以及所有子目录的所有文件中查询start字符串。 <BR> <BR> 11.2.2 gawk的使用方法 <BR> <BR> gawk是awk的一个实现,awk是一种用来处理报告等文本文件的脚本语言。不过,我们 <BR>介绍这个产品的主要目标是用它来处理各种程序的记账文件。对于复杂的脚本,还是用 <BR>Perl比较合适。 <BR> <BR> gawk 的主要功能是针对档案的每一行搜寻指定的 模式。,每当找到一个匹配的模式 <BR>,gawk就会去执行你设定的动作。按照这个方式, gawk 依此方式处理输入档案的每一 <BR>行直到输入档案结束。如果对于某个模式没有设置对应的动作,gawk将直接将这个行显 <BR>示出来。 <BR> <BR> 为了使用gawk,你通常必须先写一个awk脚本,除非模式/动作非常简单,可以在一行 <BR>上完成。我们用一个例子来解释gawk的基本用法,首先产生一个目录列表文件: <BR> <BR> ls –l /etc > list <BR> <BR> 现在list的内容有点像这样: <BR> <BR> total 2164 <BR> <BR> drwxr-xr-x 3 root root 4096 Feb 15 22:55 CORBA <BR> <BR> -rw-r--r-- 1 root root 2045 Sep 24 1999 DIR_COLORS <BR> <BR> -rw-r--r-- 1 root root 17 Mar 25 19:59 HOSTNAME <BR> <BR> ………… <BR> <BR> 现在我们选择一个最简单的例子,简单地查找所有属性是drwxr-xr-x的目录文件: <BR> <BR> gawk '/drwxr-xr-x/ {print $0}' list <BR> <BR> 将输出所有这样的目录。 <BR> <BR> 这个例子看上去没有什么实际用处,因为用grep也可以做同样的动作,那么我们可以 <BR>看一看下面这个功能: <BR> <BR> $ gawk '$1=="-rwxr-xr-x" {sum=sum+$5} END {print sum}' list <BR> <BR> 15041 <BR> <BR> 这个是什么意思?对于所有属性是755的文件,让gawk对第五栏的数字求和。第五栏我 <BR>们可以看到就是文件的长度,因此这个命令将显示所有属性为755的文件的总共的长度。 <BR> <BR> $n是gawk中非常重要的概念,它用来表示文本串的分栏。缺省的情况下,gawk将输入 <BR>字符串(从文件中读入的每一行)按照分割的空格分成若干个字段,每个字段作为一个 <BR>变量,例如有一行 <BR> <BR> my name is 3th test <BR> <BR> 那么,在awk读入这一行之后,就产生了$1到$5变量,其中$1="my",$2="is",……… <BR>,最后$5="test"。另外还有一个特殊的变量$0,它表示整个输入行,也就是这个字符串 <BR>"my name is test"。另外还有一个特殊的变量NF,它表示当前行的字段的个数,在现在 <BR>的情况下,NF应该等于5。 <BR> <BR> 在某些特殊的情况下,你可能需要改变分割符的定义,这可以通过对FS赋值来完成, <BR>例如FS=","将分割符定义为都号而不是缺省的空格。 <BR> <BR> 在一般情况下,gawk可以从命令文件中获得模式/动作,命令文件的格式很简单,就是 <BR>直接将应该写在命令行上的模式/动作对写在文件里面,每个对构成一行,模式可以有两 <BR>种,一种是模式匹配,也就是我们在前面解释的正则表达式,如果使用正则表达式,那 <BR>么需要用两个/把它们夹在一起,例如/[A-Z]/表示正则表达式[A-Z]。 <BR> <BR> 另一种模式是比较指令,比较指令可以用比较操作符和逻辑运算符来构成,常用的比 <BR>较操作符有: <BR> <BR> == 等于 <= 不大于 ~ 按照正则表达式匹配 <BR> <BR> < 小于 >= 不小于 !~ 按照正则表达式不匹配 <BR> <BR> > 大于 != 不等于 <BR> <BR> 逻辑运算符有 <BR> <BR> && 和 || 或 ! 非 ()括号 <BR> <BR> <BR> 设定了模式后,就可以设置对应的动作了,在gawk中,动作必须用花括号括起来。ga <BR>wk能完成的动作并不多,毕竟它是一种报告分析语言。一般情况下,只要熟悉print和p <BR>rintf命令就足够了,print命令的格式非常简单: <BR> <BR> print item1,item2,………… <BR> <BR> 输出时,每个项目输出一栏,中间用空格分开。一个print后面不跟着任何变量会导致 <BR>gawk显示当前的输入行($0)。如果要输出一个字符串,使用引号把它括起来,特别是 <BR>如果要输出一个空行,使用print ""。这里是一个例子,它将list文件的头两栏输出: <BR> <BR> gawk '{print $1,$2}' list <BR> <BR> 由于输入的文本文件内容有多行,你在命令栏中设计的模式/动作会对每一行执行一次 <BR>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -