📄 perl11.htm
字号:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb_2312-80">
<title>ChinaPerl</title>
<LINK rel="stylesheet" href="article.css" type="text/css">
</head>
<body>
<p align="center">第十一章 文件系统</p>
<p align="center"><a target="_blank" href="http://flamephoenix.126.com">by flamephoenix</a></p>
<a href="#1">一、文件输入/输出函数</a><br>
<a href="#1.1">1、基本I/O函数</a><br>
<a href="#1.1.1">1)open函数</a><br>
<a href="#1.1.2">2)用open重定向输入</a><br>
<a href="#1.1.3">3)文件重定向</a><br>
<a href="#1.1.4">4)指定读写权限</a><br>
<a href="#1.1.5">5)close函数</a><br>
<a href="#1.1.6">6)print, printf和write函数 </a><br>
<a href="#1.1.7">7)select函数</a><br>
<a href="#1.1.8">8)eof函数</a><br>
<a href="#1.1.9">9)间接文件变量</a><br>
<a href="#1.2">2、跳过和重读数据</a><br>
<a href="#1.3">3、系统读写函数</a><br>
<a href="#1.4">4、用getc读取字符</a><br>
<a href="#1.5">5、用binmode读取二进制文件</a><br>
<a href="#2">二、目录处理函数</a><br>
<a href="#2.1">1、mkdir</a><br>
<a href="#2.2">2、chdir</a><br>
<a href="#2.3">3、opendir</a><br>
<a href="#2.4">4、closedir</a><br>
<a href="#2.5">5、readdir</a><br>
<a href="#2.6">6、telldir</a><br>
<a href="#2.7">7、seekdir</a><br>
<a href="#2.8">8、rewinddir</a><br>
<a href="#2.9">9、rmdir</a><br>
<a href="#3">三、文件属性函数</a><br>
<a href="#3.1">1、文件重定位函数</a><br>
<a href="#3.2">2、链接和符号链接函数</a><br>
<a href="#3.3">3、文件许可权函数</a><br>
<a href="#3.4">4、其他属性函数</a><br>
<a href="#4">四、使用DBM文件</a><br>
<br>
本章所讲的函数多数使用了UNIX操作系统的特性,在非UNIX系统中,一些函数可能没有定义或有不同的工作方式,使用时请查看Perl联机文档。<br>
<a name="1">一、文件输入/输出函数</a><br>
本节讲述从文件中读取信息和向文件写入信息的内置库函数。<br>
<a name="1.1">1、基本I/O函数</a><br>
一些I/O函数在前面的章节中已有讲述,如<br>
<blockquote>
<li>open:允许程序访问文件</li>
<li>close:终止文件访问</li>
<li>print:文件写入字符串</li>
<li>write:向文件写入格式化信息</li>
<li>printf:格式化字符串并输出到文件</li>
</blockquote>
这里简单回顾一下,再讲一些前面未提到的函数。<br>
<a name="1.1.1">1)open函数</a><br>
open函数将文件变量与某文件联系起来,提供访问文件的接口,例如:open(MYVAR, "/u/file"); 如果文件打开成功,则返回非零值,否则返回零。缺省地,open打开文件用以读取其内容,若想打开文件以写入内容,则在文件名前加个大于号:open(MYVAR, ">/u/file"); 向已有的文件末尾添加内容用两个大于号:open(MYVAR, ">>/u/file"); 若想打开文件作为数据导向的命令,则在命令前加上管道符(|):open(MAIL, "|mail dave");<br>
<a name="1.1.2">2)用open重定向输入</a><br>
可以把打开的文件句柄用作向程序输入数据的命令,方法是在命令后加管道符(|),如:<br>
open(CAT, "cat file*|");<br>
对open的调用运行命令cat file* ,此命令创建一个临时文件,这个文件的内容是所有以file打头的文件的内容连接而成,此文件看作输入文件,可用文件变量CAT访问,如:<br>
$input = <CAT>;<br>
下面的例子使用命令w的输出来列出当前登录的所有用户名。<br>
<blockquote>
1 : #!/usr/local/bin/perl<br>
2 :<br>
3 : open (WOUT, "w|");<br>
4 : $time = <WOUT>;<br>
5 : $time =~ s/^ *//;<br>
6 : $time =~ s/ .*//;<br>
7 : <WOUT>; # skip headings line<br>
8 : @users = <WOUT>;<br>
9 : close (WOUT);<br>
10: foreach $user (@users) {<br>
11: $user =~ s/ .*//;<br>
12: }<br>
13: print ("Current time: $time");<br>
14: print ("Users logged on:\n");<br>
15: $prevuser = "";<br>
16: foreach $user (sort @users) {<br>
17: if ($user ne $prevuser) {<br>
18: print ("\t$user");<br>
19: $prevuser = $user;<br>
20: }<br>
21: }
</blockquote>
结果输出如下:<br>
<blockquote>
Current time: 4:25pm<br>
Users logged on:<br>
dave<br>
kilroy<br>
root<br>
zarquon
</blockquote>
w命令列出当前时间、系统负载和登录的用户,以及每个用户的作业时间和当前运行的命令,如:<br>
<blockquote><pre>
4:25pm up 1 day, 6:37, 6 users, load average: 0.79, 0.36, 0.28
User tty login@ idle JCPU PCPU what
dave ttyp0 2:26pm 27 3 w
kilroy ttyp1 9:01am 2:27 1:04 11 -csh
kilroy ttyp2 9:02am 43 1:46 27 rn
root ttyp3 4:22pm 2 -csh
zarquon ttyp4 1:26pm 4 43 16 cc myprog.c
kilroy ttyp5 9:03am 2:14 48 /usr/games/hack
</pre></blockquote>
上例中从w命令的输出中取出所需的信息:当前时间和登录的用户名。第3行运行w命令,此处对open的调用指定w的输出用作程序的输入,用文件变量WOUT来访问该输入。第4行读取第一行信息,即:<br>
4:25pm up 1 day, 6:37, 6 users, load average: 0.79, 0.36, 0.28<br>
接下来的两行从这行中抽取出时间。首先,第5行删除起始的空格,然后第6行删去除时间和结尾换行符之间的所有字符,存入变量$time。<br>
第7行从WOUT读取第二行,这行中无有用信息,故不作处理。第8行把剩下的行赋给数组@users,然后第9行关闭WOUT,终止运行w命令的进程。<br>
@users中的每个元素都是一行用户信息,因为本程序只需要每行的第一个单词,即用户名,故10~12行去掉除换行符外的其它字符,这一循环结束后,@users中只剩下用户名的列表。<br>
第13行输出存贮在$time中的时间,注意这时print不需要加上换行符,因为$time中有。16~21行对@users中的用户名排序并输出。因为同一个用户可以多次登录,所以用$preuser存贮输出的最后一个用户名,下次输出数组元素$user时,如果其与$preser相等,则不输出。<br>
<a name="1.1.3">3)文件重定向</a><br>
许多UNIX shell可以把标准输出文件(STDOUT)和标准错误文件(STDERR)都重定向到同一个文件,例如在Bourne Shell(sh)中,命令<br>
$ foo > file1 2>&1<br>
运行命令foo并把输出到标准输出文件和标准错误文件的内容存贮到文件file1中。下面是用Perl实现这一功能的例子:<br>
<blockquote>
1: #!/usr/local/bin/perl<br>
2: <br>
3: open (STDOUT, ">file1") || die ("open STDOUT failed");<br>
4: open (STDERR, ">&STDOUT") || die ("open STDERR failed");<br>
5: print STDOUT ("line 1\n");<br>
6: print STDERR ("line 2\n");<br>
7: close (STDOUT);<br>
8: close (STDERR);
</blockquote>
运行后,文件file1中的内容为:<br>
line 2<br>
line 1<br>
可以看到,这两行并未按我们想象的顺序存贮,为什么呢?我们来分析一下这段程序。<br>
第3行重定向标准输出文件,方法是打开文件file1将它与文件变量STDOUT关联,这也关闭了标准输出文件。第4行重定向标准错误文件,参数>&STDOUT告诉Perl解释器使用已打开并与STDOUT关联的文件,即文件变量STDERR指向与STDOUT相同的文件。第5、6行分别向STDOUT和STDERR写入数据,因为这两个文件变量指向同一个文件,故两行字符串均写到文件file1中,但顺序却是错误的,怎么回事呢?<br>
问题在于UNIX对输出的处理上。当使用print(或其它函数)写入STDOUT等文件时,UNIX操作系统真正所做的是把数据拷贝到一片特殊的内存即缓冲区中,接下来的输出操作继续写入缓冲区直到写满,当缓冲区满了,就把全部数据实际输出。象这样先写入缓冲区再把整个缓冲区的内容输出比每次都实际输出所花费的时间要少得多,因为一般来说,I/O比内存操作慢得多。<br>
程序结束时,任何非空的缓冲区都被输出,然而,系统为STDOUT和STDERR分别维护一片缓冲区,并且先输出STDERR的内容,因此存贮在STDERR的缓冲区中的内容line 2出现在存贮在STDOUT的缓冲区中的内容line 1之前。<br>
为了解决这个问题,可以告诉Perl解释器不对文件使用缓冲,方法为:<br>
1、用select函数选择文件<br>
2、把值1赋给系统变量$|<br>
系统变量$|指定文件是否进行缓冲而不管其是否应该使用缓冲。如果$|为非零值则不使用缓冲。$|与系统变量$~和$^协同工作,当未调用select函数时,$|影响当前缺省文件。下例保证了输出的次序:<br>
<blockquote>
1 : #!/usr/local/bin/perl<br>
2 : <br>
3 : open (STDOUT, ">file1") || die ("open STDOUT failed");<br>
4 : open (STDERR, ">&STDOUT") || die ("open STDERR failed");<br>
5 : $| = 1;<br>
6 : select (STDERR);<br>
7 : $| = 1;<br>
8 : print STDOUT ("line 1\n");<br>
9 : print STDERR ("line 2\n");<br>
10: close (STDOUT);<br>
11: close (STDERR);
</blockquote>
程序运行后,文件file1中内容为:<br>
line 1<br>
line 2<br>
第5行将$|赋成1,告诉Perl解释器当前缺省文件不进行缓冲,因为未调用select,当前的缺省文件为重定向到文件file1的STDOUT。第6行将当前缺省文件设为STDERR,第7行又设置$|为1,关掉了重定向到file1的标准错误文件的缓冲。由于STDOUT和STDERR的缓冲均被关掉,向其的输出立刻被写到文件中,因此line 1出现在第一行。<br>
<a name="1.1.4">4)指定读写权限</a><br>
打开一个既可读又可写的文件方法是在文件名前加上"+>",如下:<br>
open (READWRITE, "+>file1");<br>
此语句打开既可读又可写的文件file1,即可以重写其中的内容。文件读写操作最好与库函数seek和tell一起使用,这样可以跳到文件任何一点。<br>
注:也可用前缀"+<"指定可读写权限。<br>
<a name="1.1.5">5)close函数</a><br>
用于关闭打开的文件。当用close关闭管道,即重定向的命令时,程序等待重定向的命令结束,如:<br>
open (MYPIPE, "cat file*|");<br>
close (MYPIPE);<br>
当关闭此文件变量时,程序暂停运行,直到命令cat file*运行完毕。<br>
<a name="1.1.6">6)print, printf和write函数</a><br>
print是这三个函数中最简单的,它向指定的文件输出,如果未指定,则输出到当前缺省文件中,如:<br>
print ("Hello, there!\n");<br>
print OUTFILE ("Hello, there!\n");<br>
第一句输出到当前缺省文件中,若未调用select,则为STDOUT。第二句输出到由文件变量OUTFILE指定的文件中。<br>
printf函数先格式化字符串再输出到指定文件或当前缺省文件中,如:<br>
printf OUTFILE (“You owe me %8.2f", $owing);<br>
此语句取出变量$owing的值并替换掉串中的%8.2f,%8.2f是域格式的例子,把$owing的值看作浮点数。<br>
write函数使用输出格式把信息输出到文件中,如:<br>
select (OUTFILE);<br>
$~ = "MYFORMAT";<br>
write;<br>
关于printf和write,详见《第x章 格式化输出》。<br>
<a name="1.1.7">7)select函数</a><br>
select函数将通过参数传递的文件变量指定为新的当前缺省文件,如:<br>
select (MYFILE);<br>
这样,MYFILE就成了当前缺省文件,当对print、write和printf的调用未指定文件时,就输出到MYFILE中。<br>
<a name="1.1.8">8)eof函数</a><br>
eof函数查看最后一次读文件操作是否为文件最后一个记录,如果是,则返回非零值,如果文件还有内容,返回零。<br>
一般情况下,对eof的调用不加括号,因为eof和eof()是等效的,但与<>操作符一起使用时,eof和eof()就不同了。现在我们来创建两个文件,分别叫做file1和file2。file1的内容为:<br>
This is a line from the first file.<br>
Here is the last line of the first file.<br>
file2的内容为:<br>
This is a line from the second and last file.<br>
Here is the last line of the last file.<br>
下面就来看一下eof和eof()的区别,第一个程序为:<br>
<blockquote>
1: #!/usr/local/bin/perl<br>
2: <br>
3: while ($line = <>) {<br>
4: print ($line);<br>
5: if (eof) {<br>
6: print ("-- end of current file --\n");<br>
7: }<br>
8: }
</blockquote>
运行结果如下:<br>
<blockquote>
$ program file1 file2<br>
This is a line from the first file.<br>
Here is the last line of the first file.<br>
-- end of current file --<br>
This is a line from the second and last file.<br>
Here is the last line of the last file.<br>
-- end of current file --<br>
$
</blockquote>
下面把eof改为eof(),第二个程序为:<br>
<blockquote>
1: #!/usr/local/bin/perl<br>
2: <br>
3: while ($line = <>) {<br>
4: print ($line);<br>
5: if (eof()) {<br>
6: print ("-- end of output --\n");<br>
7: }<br>
8: }
</blockquote>
运行结果如下:<br>
<blockquote>
$ program file1 file2<br>
This is a line from the first file.<br>
Here is the last line of the first file.<br>
This is a line from the second and last file.<br>
Here is the last line of the last file.<br>
-- end of output --$
</blockquote>
这时,只有所有文件都读过了,eof()才返回真,如果只是多个文件中前几个的末尾,返回值为假,因为还有要读取的输入。<br>
<a name="1.1.9">9)间接文件变量</a><br>
对于上述各函数open, close, print, printf, write, select和eof,都可以用简单变量来代替文件变量,这时,简单变量中所存贮的字符串就被看作文件变量名,下面就是这样一个例子,此例很简单,就不解释了。需要指出的是,函数open, close, write, select和eof还允许用表达式来替代文件变量,表达式的值必须是字符串,被用作文件变量名。<br>
<blockquote>
1: #!/usr/local/bin/perl<br>
2: <br>
3: &open_file("INFILE", "", "file1");<br>
4: &open_file("OUTFILE", ">", "file2");<br>
5: while ($line = &read_from_file("INFILE")) {<br>
6: &print_to_file("OUTFILE", $line);<br>
7: }<br>
8: <br>
9: sub open_file {<br>
10: local ($filevar, $filemode, $filename) = @_;<br>
11: <br>
12: open ($filevar, $filemode . $filename) ||<br>
13: die ("Can't open $filename");<br>
14: }<br>
15: sub read_from_file {<br>
16: local ($filevar) = @_;<br>
17: <br>
18: <$filevar>;<br>
19: }<br>
20: sub print_to_file {<br>
21: local ($filevar, $line) = @_;<br>
22: <br>
23: print $filevar ($line);<br>
24: }
</blockquote>
<a name="1.2">2、跳过和重读数据</a><br>
<p><table border="1" cellspacing="1">
<tr>
<td>函数名</td>
<td>seek</td>
</tr>
<tr>
<td>调用语法</td>
<td>seek (filevar, distance, relative_to);</td>
</tr>
<tr>
<td>解说</td>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -