📄 90.htm
字号:
<p>用VB开发标准CGI程序</p>
<p>作者:张移山</p>
<p></p>
<p> 文摘:虽然目前已经有很多可以取代CGI且性能较CGI要高的技术(例如ASP、ISAPI、NSAPI等),但使用它们需要用到专门的知识和工具,并且利用这些技术所编制的程序也只适用于特定的Web服务器或系统平台。考虑到CGI程序的易用易学性、跨服务器平台特性等优点,CGI程序还将在WWW上占有一一席之地。本文将介绍如何用VB编写标准的CGI程序,最后本文还用VB实现了一个有关主页客户留言簿的CGI程序。 </p>
<p></p>
<p> 利用通用网关接口CGI,WEB服务器可以执行一些外部程序,可以将这些外部程序所产生的输出结果和WEB服务器所管理的静态文本、图象和声音融合在一起传给相应的WEB浏览器。当客户方的浏览器向WEB服务器请求一个HTML文件时,服务器在收到请求后就去寻找这个文件并将找到的文件传送给客户方。而当客户方的请求是一个CGI程序时,WEB服务器将激活客户方所请求的CGI程序并把程序的执行结果传给客户方。 </p>
<p></p>
<p> 标准的CGI程序是通过环境变量和标准输入输出和WEB服务器交换信息的。任何一个被系统激活的进程都拥有标准输入和输出这两个文件句柄,CGI程序的进程也不例外。不过当CGI程序被WEB服务器激活以后,它的标准输入STDIN被连接到WEB服务器的标准输出STDOUT上,而CGI程序的标准输出STDOUT则被连到服务器的标准输入STDIN上。因此CGI程序从标准输入读取信息也就是从WEB服务器的标准输出读信息,而它向标准输出写信息也就是向WEB服务器的标准输入写信息。 </p>
<p></p>
<p> WEB服务器一般将客户方传送来的信息放在它的标准输出和相关环境变量中,而CGI程序则从环境变量和它的标准输入(也就是WEB服务器的标准输出)获取所需的信息,程序的最终输出结果则被写向它的标准输出STDOUT(也就是WEB服务器的标准输入)。WEB服务器将从它的标准输入STDIN(也就是CGI程序的标准输出)获取CGI程序的输出结果并将它传送给客户方。客户方、WEB服务器和CGI程序之间的信息交流如图1所示,显然,WEB服务器就象是客户方和CGI程序间的中介人。 </p>
<p></p>
<p> WEB服务器、CGI程序间的这种标准框架在UNIX系统下和微软视窗环境中的字符方式下可以工作得非常好,因为此时系统所产生的所有进程都可以存取标准输入和标准输出。但对于微软视窗环境图形方式下的程序就不行了,这是由于它们无法存取标准输入和标准输出。为了解决这一问题,微软在Win32系统中创建了另一类型的标准输入和标准输出,程序可以通过调用Win32 API函数存取标准输入和标准输出,不过这就意味着使用这类标准输入和标准输出的CGI程序都必须是32位的。 </p>
<p></p>
<p> 微软视窗环境下的其它一些WEB服务器(例如Website)则使用另外一种特殊的技术即利用INI文件来实现WEB服务器和CGI程序间的数据交流。采用这种被称为Win-CGI规范编写的CGI程序通常只能在部分WEB服务器上运行。一般支持Win-CGI的WEB服务器将客户端的输入和有关的状态信息写入一个INI文件中,而CGI程序则从该INI文件获取相关信息,这类程序的执行效率将没有标准CGI程序高。 </p>
<p></p>
<p> 在进行CGI编程时,您只要使CGI程序从标准输入和环境变量中获取客户方提供的信息,把要传送给客户方的输出结果写入标准输出,剩下的信息传递工作WEB服务器将自动完成。通用网关接口CGI只是规定了一个标准的接口规范,只要遵守这个标准规范,程序开发人员可以利用各种编程工具例如Perl、C、Fortran、Visual Basic等进行CGI编程。考虑到Visual Basic的强大的数据库处理能力、客户服务器模式的编程能力以及字符串处理能力,本文将介绍如何用VB编写标准的CGI程序。 </p>
<p></p>
<p> 一. 输入输出的处理 </p>
<p></p>
<p> 一个CGI程序被激活以后,它首先要做的事情就是确定系统平台、WEB服务器和客户端浏览器的状态信息、客户端用户的输入数据,最后它还必须将相关信息能传送给客户端,否则它将一事无成。这些操作都是通过存取环境变量和标准输入输出完成的。用VB编写的CGI程序可以通过调用函数Environ( )来获取相关环境变量的值。存取标准输入输出就要在程序中使用Win32API函数GetStdHandle( )、ReadFile( )和WriteFile( ),在使用这些函数时首先必须在程序中声明它们。 </p>
<p></p>
<p> 以下的CGI程序说明了在VB-CGI程序中如何处理环境变量和标准输入输出,该CGI程序非常简单,可以将标准输入中的信息不经任何处理就返回给客户端,它可以被任何表单用POST方法激活: </p>
<p></p>
<p> Declare Function GetStdHandle Lib "kernel32" (ByVal nStdHandle As Long) As Long </p>
<p></p>
<p> Declare Function ReadFile Lib "kernel32" (ByVal hFile As Long, lpBuffer As Any, _ </p>
<p></p>
<p> ByVal nNumberOfBytesToRead As Long, lpNumberOfBytesRead As Long, _ </p>
<p></p>
<p> lpOverlapped As Any) As Long </p>
<p></p>
<p> Declare Function WriteFile Lib "kernel32" (ByVal hFile As Long, ByVal lpBuffer As String, _ </p>
<p></p>
<p> ByVal nNumberOfBytesToWrite As Long, lpNumberOfBytesWritten As Long, _ </p>
<p></p>
<p> lpOverlapped As Any) As Long </p>
<p></p>
<p> Public Const STD_INPUT_HANDLE = -10& </p>
<p></p>
<p> Public Const STD_OUTPUT_HANDLE = -11& </p>
<p></p>
<p> Public Const FILE_BEGIN = 0& </p>
<p></p>
<p> Public hStdIn As Long ' 标准输入文件句柄 </p>
<p></p>
<p> Public hStdOut As Long ' 标准输出文件句柄 </p>
<p></p>
<p> Sub Main() </p>
<p></p>
<p> Dim CGI_ContentLength As String,CGI_QueryString As String </p>
<p></p>
<p> Dim lContentLength As Long ' 标准输入中的字符串的长度 </p>
<p></p>
<p> Dim sBuff As String ' 用于存储标准输入中的字符串 </p>
<p></p>
<p> Dim lBytesRead As Long ' 实际读入的字符个数 </p>
<p></p>
<p> Dim rc As Long </p>
<p></p>
<p> Dim sFormData As String </p>
<p></p>
<p> '调用系统函数生成标准输入输出文件句柄 </p>
<p></p>
<p> hStdIn = GetStdHandle(STD_INPUT_HANDLE) </p>
<p></p>
<p> hStdOut = GetStdHandle(STD_OUTPUT_HANDLE) </p>
<p></p>
<p> '获取环境变量CONTENT_LENGTH的值,并将它转换为整型 </p>
<p></p>
<p> CGI_ContentLength = Environ("CONTENT_LENGTH") </p>
<p></p>
<p> lContentLength = Val(CGI_ContentLength) </p>
<p></p>
<p> sBuff = String(lContentLength, Chr$(0)) </p>
<p></p>
<p> '从标准输入中读数据 </p>
<p></p>
<p> rc = ReadFile(hStdIn, ByVal sBuff, lContentLength, lBytesRead, ByVal 0&) </p>
<p></p>
<p> sFormData = Left$(sBuff, lBytesRead) </p>
<p></p>
<p> OutPut "Content-type: text/html" & vbCrLf </p>
<p></p>
<p> OutPut "〈HTML〉〈HEAD〉" </p>
<p></p>
<p> OutPut "〈TITLE〉表单传送数据的方法POST 〈/TITLE〉〈/HEAD〉" </p>
<p></p>
<p> OutPut "〈BODY〉〈H3〉表单传送数据的方法POST〈/H3〉 " </p>
<p></p>
<p> OutPut "〈P〉本CGI 程序由Visual Basic编制! " </p>
<p></p>
<p> OutPut "〈P〉POST方法传送的数据: " </p>
<p></p>
<p> OutPut "〈P〉" & sBuff </p>
<p></p>
<p> OutPut "〈/BODY〉〈/HTML〉" </p>
<p></p>
<p> End Sub </p>
<p></p>
<p> Sub OutPut(s As String) ' 定义一个向标准输出写信息的函数 </p>
<p></p>
<p> Dim lBytesWritten As Long </p>
<p></p>
<p> s = s & vbCrLf </p>
<p></p>
<p> WriteFile hStdOut, s, Len(s), lBytesWritten, ByVal 0& </p>
<p></p>
<p> End Sub </p>
<p></p>
<p> 一般用VB编译生成的CGI程序不能正确处理中文信息。这主要表现在CGI程序向STDOUT输出的中文在WEB页面上无法正确显示,可以通过在该中文字符串后跟着输出一些空格来解决这个问题。当使用HTML标识符〈P〉、〈/P〉对WEB页面进行排版时,浏览器在显示该WEB页面时会吃掉多余的空格而只保留一个,这种情况下这些空格对WEB页面的外观基本没有影响。如果使用HTML标识符〈PRE〉、〈/PRE〉对WEB页面进行排版,由于空格不能被浏览器吃掉,WEB页面的外观将会受到很大的影响。不过这时可以用HTML的表格〈table〉、〈P〉来代替〈PRE〉对WEB页面进行排版。 </p>
<p></p>
<p> 注意整个CGI程序的主体必须放在MAIN()函数中。 </p>
<p></p>
<p> 二. URL解码 </p>
<p></p>
<p> 由于WEB服务器和浏览器对于一些特殊的字符不能正确处理,WEB服务器和浏览器之间可能会由此产生而某种程度的误会,因此在数据被传送之前,浏览器都要对表单内客户输入的数据中的特殊字符进行URL译码。 </p>
<p></p>
<p> 例如WEB系统用“=”分解表单各元素的NAME和VALUE属性,用“&”分解不同表单元素的输入数据,如果在表单的输入数据中包含这些特殊的字符,并且表单的数据在传送给WEB服务器前不做任何处理,WEB服务器将无法知道哪一个“=”、“&”是用户输入的,哪一个是浏览器加的。在由表单属性ACTION定义的URL中,也可能出现一些特殊的字符,当在CGI程序的名称中和路径信息(Path Information)中出现象“=”、“&”和“?”时,都会影响数据的正确传送。 </p>
<p></p>
<p> URL译码(URL Encoding)就是将WEB服务器所不能正确处理的特殊字符转换成它的十六进制数的形式,比如将“%”转换成“%25”、“=”转换成“%3D”等等。这些特殊的字符通常被称为WEB系统的保留字符。通常在WEB系统上不论是用GET方法还是用POST方法传送的数据都要进行URL译码。CGI程序要想处理表单传送来的数据,还必须对浏览器URL译码过的数据进行解码,理解URL译码对对于我们进行CGI编程是非常重要的。一般URL译码的步骤如下: </p>
<p></p>
<p> 1. 浏览器将所传送的数据根据表单所包含的元素分解成“NAME=VALUE”的形式,NAME和VALUE分别是表单元素的属性,其中VALUE属性中存储客户方在表单中输入的数据,如果客户方没有输入数据,则VALUE存储的是表单定义的缺省值,如果缺省值也没有定义,则VALUE值为空; </p>
<p></p>
<p> 2. 代表表单中各元素的各个“NAME=VALUE”对被浏览器用“&”连接起来; </p>
<p></p>
<p> 3. VALUE属性中存放的数据若含有空格,则被转换成“+”; </p>
<p></p>
<p> 4. URL和输入数据中所包含的WEB系统的保留字符必须被译码成它们的十六进制数的形式。 </p>
<p></p>
<p> 5. 被译码后的字符被表示成一个“%”和它们的十六进制数(%HH)。 </p>
<p></p>
<p> CGI程序从环境变量“QUERY_STRING”或标准输入中读入的数据是经过浏览器URL译码的,在使用这些数据以前还必须对它们进行URL解码。解码的目的就是将数据还原成客户在WEB页面上输入时的形式。本文已经介绍了URL译码,URL解码和它正相反,一般它有以下的工作要做: </p>
<p></p>
<p> 1. 从浏览器用GET或POST方法所传送来的数据中找出代表各个表单元素所储存数据的“NAME=VALUE”对。 </p>
<p></p>
<p> 2. VALUE属性中存放的数据若含有“+”,则被转换成空格。 </p>
<p></p>
<p> 3. 将VALUE属性中存放的数据的十六进制数“%HH”转换成相应的字符。 </p>
<p></p>
<p> WEB系统将汉字当成特殊的字符,对它也要进行URL译码。对于一个特殊的单字节字符比如“/”,浏览器通常将它译码成十六进制数的形式比如%2F,“%”表示它后面跟的是两位十六进制数。当VB程序对其进行处理时调用Chr$函数就可以将其恢复为原来的面貌。而一个汉字则被浏览器译码成四位十六进制数,比如%D5%C5,如果CGI程序还象以前一样分别调用Chr(D5)和Chr(C5),由于D5、C5都不是正常的单字节十六进制数码,Chr函数返回空,汉字将无法正确还原。正确的作法应该是将有关汉字的四位十六进制数一起传给函数Chr,如Chr(D5C5),此时汉字才能被正确还原。 </p>
<p></p>
<p> 因此可以让CGI程序对四位连续的十六进制数一起进行译码以使汉字被正确还原。但在这种情况下当客户端用户输入了两个连续的WEB系统保留字符时CGI程序又可能把它们当成汉字来处理。这时可以让CGI程序在需要对四位连续的十六进制数进行译码时首先检查前面两位是否为WEB系统的保留字符,如果是则仍然按照单字节的字符处理。不过如果客户端用户在表单内填写了很多汉字,CGI程序的负担将会大大加重。事实上大多数情况下客户端用户很少会使用两个连续的WEB系统的保留字符,可以只让CGI程序对最容易出现的情形如“://”(当客户端用户在表单中输入某一URL时会出现这种情况)进行检查,本文下节提供的函数UrlDecode( )可以实现对汉字和WEB系统保留字符的URL解码。 </p>
<p></p>
<p> 三. CGI编程实例 </p>
<p></p>
<p> 本节将用VB编写一个处理主页客户留言簿的CGI程序。除了本文前面所介绍的Win32API函数,程序中还调用了Win32API函数GetTempFileName()以获得一个唯一的临时文件名。程序中的函数UrlDecode()用来对客户端的输入进行URL译码,函数GetCgiValue()则用来分解字符串,根据表单元素的NAME属性获取其VALUE值,并调用UrlDecode()函数对其进行URL译码。 </p>
<p></p>
<p> 本程序要求在留言簿文件guests.html中使用一个定位串“〈! ENDHEAD 〉”以将文件的开始部分和具体的客户留言部分分开,CGI程序将在“〈! ENDHEAD 〉”所在的位置插入客户新的留言。guests.html应具有如下的形式: </p>
<p></p>
<p> 〈html〉 </p>
<p></p>
<p> 〈head〉〈title〉DHTML Zone 〈/title〉〈/head〉 </p>
<p></p>
<p> 〈body bgcolor="#FFFFFF" text="#00000" vlink="#990000" link="#333399"〉 </p>
<p></p>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -