文章摘要:
CGI規定了Web伺服器調用其他可執行程式(CGI程 序)的介面協議標準。Web伺服器通過調用CGI程式實現和Web瀏覽器的互動。CGI程式可以用任何程式設計語言編寫,如Shell指令碼語言、Perl、Fortran、Pascal、C語言等。但是用C語言編寫的CGI程式具有執行速度快、安全性高等特點。本文詳細分析了用C語言進行CGI程式設計的方法、過程和技巧。
本文:
用C語言進行CGI程式設計
一、CGI概述
CGI(Common Gateway Interface: 公用網關介面)規定了Web伺服器調用其他可執行程式(CGI程 序)的介面協議標準。Web伺服器通過調用CGI程式實現和Web瀏覽器的互動,也就是CGI程式接受Web瀏覽器發送給Web伺服器的資訊,進行處理,將響應結果再回送給Web伺服器及Web瀏覽器。CGI程式一般完成Web網頁中表單(Form)資料的處理、資料庫查詢和實現與傳統應用系統的整合等工作。CGI程式可以用任何程式設計語言編寫,如Shell指令碼語言、Perl、Fortran、Pascal、C語言等。但是用C語言編寫的CGI程式具有執行速度快、安全性高(因為C語言程式是編譯執行且不可被修改)等特點。
CGI介面標準包括標準輸入、環境變數、標準輸出三部分。
1.標準輸入
CGI程式像其他可執行程式一樣,可通過標準輸入(stdin)從Web伺服器得到輸入資訊,如Form中的資料,這就是所謂的向CGI程式傳遞資料的POST方法。這意味著在作業系統命令列狀態可執行CGI程式,對CGI程式進行調試。POST方法是常用的方法,本文將以此方法為例,分析CGI程式設計的方法、過程和技巧。
2.環境變數
作業系統提供了許多環境變數,它們定義了程式的執行環境,應用程式可以存取它們。Web伺服器和CGI介面又另外設定了自己的一些環境變數,用來向CGI程式傳遞一些重要的參數。CGI的GET方法還通過 環境變數QUERY-STRING向CGI程式傳遞Form中的資料。
3.標準輸出
CGI程式通過標準輸出(stdout)將輸出資訊傳送給Web伺服器。傳送給Web伺服器的資訊可以用各種格式,通常是以純文字或者HTML文本的形式,這樣我們就可以在命令列狀態調試CGI程式,並且得到它們的輸出。
下面是一個簡單的CGI程式,它將HTML中Form的資訊直接輸出到We b瀏覽器。
# include <stdio.h>
# include <stdib.h>
main()
{
int i , n ;
printf (″Content type: text/plain/n/n″);
n=0;
if(getenv(″CONTENT-LENGTH″))
n=atoi(getenv(CONTENT-LENGTH″));
for (i=0;i<n;i++)
putchar(getchar());
putchar (′/n′);
fflush(stdout);
}
下面對此程式作一下簡要的分析。
prinft (″Content type :text/plain/n/n″);
此行通過標準輸出將字串″Content type :text/plain/n/n″傳送給Web伺服器。它是一個MIME頭資訊,它告訴Web伺服器隨後的輸出是以純ASCII文本的形式。請注意在這個頭資訊中有兩個新行符,這是因為Web伺服器需要在實際的文本資訊開始之前先看見一個空行。
if (getenv(″CONTENT-LENGTH″))
n=atoi (getenv(″CONTENT-LENGTH″));
此行首先檢查環境變數CONTENT-LENGTH是否存在。Web伺服器在調用使用POST方法的CGI程式時設定此環境變數,它的文本值表示Web伺服器傳送給CGI程式的輸入中的字元數目,因此我們使用函數atoi() 將此環境變數的值轉換成整數,並賦給變數n。請注意Web伺服器並不以檔案結束符來終止它的輸出,所以如果不檢查環境變數CONTENT-LENGTH,CGI程式就無法知道什麼時候輸入結束了。
for (i=0;i<n;i++)
putchar(getchar());
此行從0迴圈到(CONTENT-LENGTH-1)次將標準輸入中讀到的每一個字元直接拷貝到標準輸出,也就是將所有的輸入以ASCII的形式回送給Web伺服器。
通過此例,我們可將CGI程式的一般工作過程總結為如下幾點。
1.通過檢查環境變數CONTENT-LENGTH,確定有多少輸入;
2.迴圈使用getchar()或者其他檔案讀函數得到所有的輸入;
3.以相應的方法處理輸入;
4.通過″Contenttype:″頭資訊,將輸出資訊的格式告訴Web伺服器;
5.通過使用printf()或者putchar()或者其他的檔案寫函數,將輸出傳送給Web伺服器。
總之,CGI程式的主要任務就是從Web伺服器得到輸入資訊,進行處理,然後將輸出結果再送回給Web伺服器。
二、環境變數
環境變數是文本串(名字/值對),可以被OS Shell或其他程式設定 ,也可以被其他程式訪問。它們是Web伺服器傳遞資料給CGI程式的簡單手段,之所以稱為環境變數是因為它們是全域變數,任何程式都可以存取它們。
下面是CGI程式設計中常常要用到的一些環境變數。
HTTP-REFERER:調用該CGI程式的網頁的URL。
REMOTE-HOST:調用該CGI程式的Web瀏覽器的機器名和網域名稱。
REQUEST-METHOD:指的是當Web伺服器傳遞資料給CGI程式時所採用的方法,分為GET和POST兩種方法。GET方法僅通過環境變數(如QUERY-STRING)傳遞資料給CGI程式,而POST方法通過環境變數和標準輸入傳遞資料給CGI程式,因此POST方法可較方便地傳遞較多的資料給CGI程式。
SCRIPT-NAME:該CGI程式的名稱。
QUERY-STRING:當使用POST方法時,Form中的資料最後放在QUERY-STRING中,傳遞給CGI程式。
CONTENT-TYPE:傳遞給CGI程式資料的MIME類型,通常為″applica tion/x-www-form-url encodede″,它是從HTML Form中以POST方法傳遞資料給CGI程式的資料編碼類別型,稱為URL編碼類別型。
CONTENT-LENGTH:傳遞給CGI程式的資料字元數(位元組數)。
在C語言程式中,要訪向環境變數,可使用getenv()庫函數。例如:
if (getenv (″CONTENT-LENGTH″))
n=atoi(getenv (″CONTENT-LENGTH″));
請注意程式中最好調用兩次getenv():第一次檢查是否存在該環境變數,第二次再使用該環境變數。這是因為函數getenv()在給定的環境變數名不存在時,返回一個NULL(空)指標,如果你不首先檢查而直接引用它,當該環境變數不存在時會引起CGI程式崩潰。
三、From輸入的分析和解碼
1.分析名字/值對
當使用者提交一個HTML Form時,Web瀏覽器首先對Form中的資料以名字/值對的形式進行編碼,並發送給Web伺服器,然後由Web伺服器傳遞給CGI程式。其格式如下:
name1=value1&name2=value2&name3=value3&name4=value4&...
其中名字是Form中定義的INPUT、SELECT或TEXTAREA等標置(Tag)名字,值是使用者輸入或選擇的標置值。這種格式即為URL編碼,程式中需要對其進行分析和解碼。要分析這種資料流,CGI程式必須首先將資料流分解成一組組的名字/值對。這可以通過在輸入資料流中尋找下面的兩個字元來完成。
每當找到字元=,標誌著一個Form變數名字的結束;每當找到字元& ,標誌著一個Form變數值的結束。請注意輸入資料的最後一個變數的值不以&結束。
一旦名字/值對分解後,還必須將輸入中的一些特殊字元轉換成相應的ASCII字元。這些特殊字元是:
+:將+轉換成空格符;
%xx:用其十六進位ASCII碼值表示的特殊字元。根據值xx將其轉換成相應的ASCII字元。
對Form變數名和變數值都要進行這種轉換。下面是一個對Form資料進行分析並將結果回送給Web伺服器的CGI程式。
#include <stdio.h>
#include <stdlib.h>
#include <strings.h>
int htoi(char *);
main()
{
int i,n;
char c;
printf (″Contenttype: text/plain/n/n″);
n=0;
if (getenv(″CONTENT-LENGTH″))
n=atoi(getenv(″CONTENT-LENGTH″));
for (i=0; i<n;i++){
int is-eq=0;
c=getchar();
switch (c){
case ′&′:
c=′/n′;
break;
case ′+′:
c=′ ′;
break;
case ′%′:{
char s[3];
s[0]=getchar();
s[1]=getchar();
s[2]=0;
c=htoi(s);
i+=2;
}
break;
case ′=′:
c=′:′;
is-eq=1;
break;
};
putchar(c);
if (is-eq) putchar(′ ′);
}
putchar (′/n′);
fflush(stdout);
}
/* convert hex string to int */
int htoi(char *s)
{
char *digits=″0123456789ABCDEF″;
if (islower (s[0])) s[0]=toupper(s[0]);
if (islower (s[1])) s[1]=toupper(s[1]);
return 16 * (strchr(digits, s[0]) -strchr (digits,′0′)
)
+(strchr(digits,s[1])-strchr(digits,′0′));
}
上面的程式首先輸出一個MIME頭資訊給Web伺服器,檢查輸入中的字元數,並迴圈檢查每一個字元。當發現字元為&時,意味著一個名字/值對的結束,程式輸出一個空行;當發現字元為+時,將它轉換成空格; 當發現字元為%時,意味著一個兩字元的十六進位值的開始,調用htoi()函數將隨後的兩個字元轉換為相應的ASCII字元;當發現字元為=時,意味著一個名字/值對的名字部分的結束,並將它轉換成字元:。最後將轉換後的字元輸出給Web伺服器。
四、產生HTML輸出
CGI程式產生的輸出由兩部分組成:MIME頭資訊和實際的資訊。兩部分之間以一個空行分開。我們已經看到怎樣使用MIME頭資訊″Content type :text/plain/n/n″和printf()、put char()等函數調用來輸 出純ASCII文本給Web伺服器。實際上,我們也可以使用MIME頭資訊″Content type :text/html/n/n″來輸出HTML原始碼給Web伺服器。請注意任何MIME頭資訊後必須有一個空行。一旦發送這個MIME頭資訊給We b伺服器後,Web瀏覽器將認為隨後的文本輸出為HTML原始碼,在HTML原始碼中可以使用任何HTML結構,如超鏈、映像、Form,及對其他CGI程 序的調用。也就是說,我們可以在CGI程式中動態產生HTML原始碼輸出 ,下面是一個簡單的例子。
#include <stdio.h>
#include <string.h>
main()
{
printf(″Contenttype:text/html/n/n″);
printf(″<html>/n″);
printf(″<head><title>An HTML Page From a CGI</title></h ead>/n″);
printf(″<body><br>/n″);
printf(″<h2> This is an HTML page generated from with i n a CGI program.. .</h2>/n″);
printf(″<hr><p>/n″);
printf(″<a href="../output.html#two"><b> Go back to out put.html page <
/b></a>/n″);
printf(″</body>/n″);
printf(″</html>/n″);
fflush(stdout);
}
上面的CGI程式簡單地用printf()函數來產生HTML原始碼。請注意在輸出的字串中如果有雙引號,在其前面必須有一個後斜字元/, 這是因為整個HTML代碼串已經在雙引號內,所以HTML代碼串中的雙引號符必須用一個後斜字元/來轉義。
五、結束語
本文詳細分析了用C語言進行CGI程式設計的方法、過程和技巧。C語言的CGI程式雖然執行速度快、可靠性高,但是相對於Perl語言來說,C語言缺乏強有力的字串處理能力,因此在實際應用中,應根據需 要和個人愛好來選擇合適的CGI程式設計語言。
Turbo C++是一種使用靈活的高效程式設計語言,在C++ Builder不斷更新的今天,Turbo C++仍是一種WINDOWS下的優秀開發環境,特別是在CGI程式開發方面與其它編程環境有著許多難以比擬的優點,它代碼效率高、編譯器運行速度快且安全環保(不向WINDOWS註冊表填加任何資訊),是WEBMASTER的首選WEB開發語言之一。
本文的CGI程式編程執行個體是在下述環境下開發調試啟動並執行:
1、WINDOWS9X作業系統
2、SAMBAR4.2一體化伺服器軟體(免費下載http://www.sambar.com)
3、Turbo C++ 3.0開發環境
上述軟體的安裝條件是:
WINDOWS9X軟體安裝好後需要安裝TCP/IP協議,在安裝SAMBAR伺服器軟體時,其安裝路徑選為C:/SAMBAR且標準方式CGI路徑及WINDOWS方式CGI路徑分別為C:/SAMBAR/CGI-BIN及C:/SAMBAR/CGI-WIN,WEB伺服器的連接埠為8080,WEB的ROOT目錄為C:/SAMBAR/DOCS
我們先看一下標準CGI程式顯示一段文字的樣本,它幾乎是“hello world”的變體(大多數語言的入門性樣本)。
樣本一:在瀏覽器上顯示一段文字。
# include <stdio.h>
# include <stdlib.h>
void main()
{
printf("HTTP/1.00 OK/n");
printf("Content-Type: text/html/n");
printf("<html>/n");
printf("<html><title>TC CGITEST1</title><body>/n");
printf("<H1><CENTER>HELLO WORLD!<br><br>/n");
printf("這是用TURBO C++ 3.0 編寫的SERVER端CGI程式<br><br>/n");
printf("簡直是酷呆了!</CENTER></H1>/n");
printf("</body></html>");
}
將上面的程式在Turbo C++下編譯成CGITEST1.EXE並把它儲存在C:/SAMBAR/CGI-BIN目錄下。在本機電腦上開啟IE瀏覽器並在URL處輸入http://localhost:8080/cgi-bin/cgitest1.exe ,執行後瀏覽器上就會顯示出 “HELLO WORLD 這是用TURBO C++ 3.0 編寫的SERVER端CGI程式 簡直是酷呆了!”的一段大字。從上面的這段程式可以看出,用Turbo C++編寫CGI程式時向STDOUT輸出,實際上就是在向瀏覽器頁面輸出。
樣本二:編寫CGI方式的訪問計數器
計數器在WEB頁面上被經常使用,它可以記錄網站被訪問的次數,一般以文字或圖形兩種方式顯示,下面我講一下文字方式的顯示方式(把它處理一下,將計數值與對應的GIF圖形進行組合就可變成圖形方式的計數值顯示)。
首先在C:/SAMBAR/DOCS下建立CGITEST2.DAT並在該文字檔內寫入計數器的初始值,如:9871
# include <stdio.h>
# include <stdlib.h>
# include <ctype.h>
# include <conio.h>
# include <string.h>
void main()
{
long int counter;
char newvalue[10];
char invalue[10];
FILE *fileh;
fileh=fopen("c://sambar//docs//cgitest2.dat","r+t");
fgets(invalue,10,fileh);
fclose(fileh);
counter=atol(invalue);
ultoa(counter+1,newvalue,10);
fileh=fopen("c://sambar//docs//cgitest2.dat","r+w");
fputs(newvalue,fileh);
fclose(fileh);
printf("HTTP/1.00 OK/n");
printf("Content-Type: text/html/n");
printf("<html>/n");
printf("<html><title>TC CGITEST2</title><body>/n");
printf("<H1>%s</H1>/n",invalue);
printf("</body></html>/n");
}
將上面的程式編譯後形成CGITEST2.EXE並考入C:/SAMBAR/CGI-BIN子目錄,在本機電腦IE瀏覽器的URL處輸入http://localhost:8080/cgi-bin/cgitest2.exe執行後便會顯示9871,以後每按一下重新整理鈕,它的計數值就會自動加一。
下面看一下常用的留言薄CGI來源程式。
首先建立 C:/SAMBAR/DOCS/MYPROGS/BOOKREC 檔案夾,在該檔案下寫一個BOOK.HTM,它就是用來存放客戶留言的原始HTM檔案,其內容如下:
<html>
<head>
<meta http-equiv="Content-Type"
content="text/html; charset=gb_2312-80">
<meta name="GENERATOR" content="Microsoft FrontPage Express 2.0">
<title>客戶留言薄</title>
</head>
<body background="../../../myprogs/bookrec/backg01.gif" bgcolor="#FFFFFF"
text="#000000" link="#000000" vlink="#000000" alink="#000000">
<p align="center"><font color="#0000A0" size="7"><b>來訪者留言</b></font>
<font color="#0000A0" size="5"> </font></p>
<p align="left"><a href="../../../../myprogs/bookrec/addbook.htm"><font
color="#0000FF">添加新留言</font></a><font color="#0000FF"> </font><a
href="../../../../../"><font color="#0000FF">返回本站首頁</font></a></p>
<hr>
<!--top-->
<b>IT IS VERY GOOD.</b><br>
SONGYQ <<A HREF="mailto:SONGYQ@371.NET">SONGYQ@371.NET
</A>><HR>
</body>
</html>
上面的BOOK.HTM有兩個連結,一個是添加新留言,另一個是返回本站首頁。添加新留言的功能是執行 addbook.htm ,它顯然是一個用於輸入留言的表單,而返回本站首頁則只是簡單地執行 ../../../../../ ,將瀏覽器的URL退回至網站的起始位置,即:http://localhost:8080/
可以直接顯示上面的BOOK.HTM來顯示使用者的留言,但最好是通過CGI程式把它顯示出來,這樣在添加新留言後可以免去按重新整理鈕(如果是直接顯示BOOK.HTM則必須重新整理才能看見新加的留言)。下面的程式CGITEST3.EXE用於顯示上面的BOOK.HTM
# include <stdio.h>
void main()
{
char invalue[512];
FILE *fileh;
printf("HTTP/1.00 OK/n");
printf("Content-Type: text/html/n");
printf("<html>/n");
fileh=fopen("c://sambar//docs//myprogs//bookrec//book.htm","r+t");
while (!feof(fileh))
{
fgets(invalue,500,fileh);
printf(invalue);
}
fclose(fileh);
}
程式CGITEST3.EXE的功能只是將BOOK.HTM檔案開啟,讀一行,在遊覽器上顯示一行,當BOOK.HTM的內容發生變化時,執行CGITEST3.EXE可以把其中所有的內容顯示出來。除了顯示使用者的留言外,下面是添加留言addbook.htm的內容:
<html>
<head>
<meta http-equiv="Content-Type"
content="text/html; charset=gb_2312-80">
<meta name="GENERATOR" content="Microsoft FrontPage Express 2.0">
<title>添加新留言</title>
</head>
<body background="../../../myprogs/bookrec/backg01.gif" bgcolor="#FFFFFF"
text="#000000" link="#000000" vlink="#000000" alink="#000000">
<p align="center"><font color="#0000A0" size="7"><b>添加新留言</b></font>
<br>
<br>
</p>
<form action="/cgi-bin/bookrec.exe" method="GET">
<table border="0" cellpadding="5">
<tr>
<td>姓 名(<i>必須的</i>)</td>
<td><!--webbot bot="Validation"
s-display-name="acvd" s-data-type="String"
b-allow-letters="TRUE" --><input type="text"
size="40" name="name"></td>
</tr>
<tr>
<td>電子郵箱</td>
<td><input type="text" size="40" name="email"></td>
</tr>
<tr>
<td valign="top">您的留言 (<i>必須的</i>)</td>
<td><textarea name="msg" rows="12" cols="60"></textarea></td>
</tr>
<tr>
<td> </td>
<td><input type="submit" value=" 提 交 "></td>
</tr>
</table>
</form>
<p align="center">本程式僅使用 HTM標記語言及CGI編譯語言,提交後可以看到新的留言。</p>
<p align="center">中海石油技術服務公司<br>技術發展中心<br>維修製造中心著作權</p>
<p align="center">Email: <a href="mailto:wxzx@petrotech.com.cn">
wxzx@petrotech.com.cn</a><br>
電話:010-84522288-8164-1</p>
</body>
</html>
上面的addbook.htm是一個表單,它傳送給/cgi-bin/bookrec.exe三個有用的參數name、email和msg,而/cgi-bin/bookrec.exe的作用是取得這三個參數,然後適當變換後把新的內容加到book.htm檔案<!--top-->標記的下面,這樣當執行CGITEST3.EXE時,新的留言與舊的留言一起就被顯示出來,新的留言先出現,舊的留言後出現,下面是bookrec.exe的Turbo C++來源程式CGITEST4.CPP:
# include <stdio.h>
# include <stdlib.h>
# include <ctype.h>
# include <conio.h>
# include <string.h>
void main()
{
char *cstring;
char estring1[512], estring2[512], estring3[512];
char invalue[512];
int check;
char *param, *temp;
char *cmpstr, *orgstr;
char *oldfile, *newfile, *ostring;
FILE *fileh, *filej;
cmpstr="<!--top-->";
cstring=getenv("QUERY_STRING");
strcpy(ostring,cstring);
strcpy(estring1,cstring);
param=strstr(estring1,"&");
strcpy(estring2,param);
strcpy(param,"/0");
temp=estring2+1;
strcpy(estring2,temp);
param=strstr(estring2,"&");
strcpy(estring3,param);
strcpy(param,"/0");
temp=estring3+1;
strcpy(estring3,temp);
param=strstr(estring1,"=");
temp=param+1;
strcpy(estring1,temp);
param=strstr(estring2,"=");
temp=param+1;
strcpy(estring2,temp);
param=strstr(estring3,"=");
temp=param+1;
strcpy(estring3,temp);
//name, email, msg are seperated
filej=fopen("c://sambar//docs//myprogs//bookrec//nbook.htm","w");
fileh=fopen("c://sambar//docs//myprogs//bookrec//book.htm","r");
while (!feof(fileh))
{
fgets(invalue,500,fileh);
strcpy(orgstr,invalue);
strcpy(orgstr+10,"/0");
check=stricmp(orgstr,cmpstr);
if (check==0){
//fputs new comments from guest
fputs(invalue,filej);
fputs("<b>",filej);
fputs(estring3,filej);
fputs("</b><br>/n",filej);
fputs(estring1,filej);
fputs(" <<A HREF=",filej);
strset(temp,34);
strcpy(temp+1,"/0");
fputs(temp,filej);
fputs("mailto:",filej);
fputs(estring2,filej);
fputs(temp,filej);
fputs(">",filej);
fputs(estring2,filej);
fputs("</A>><HR>/n",filej);
}
else
fputs(invalue,filej);
}
fclose(fileh);
fclose(filej);
oldfile="c://sambar//docs//myprogs//bookrec//book.htm";
newfile="c://sambar//docs//myprogs//bookrec//nbook.htm";
remove(oldfile);
rename(newfile,oldfile);
printf("Your message has been added<br>/n");
printf("<a href=");
printf(temp);
printf("/cgi-bin/cgitest3.exe");
printf(temp);
printf(">SEE GUEST BOOK</A><br>/n");
printf("<a href=");
printf(temp);
printf("../../../");
printf(temp);
printf(">RETURN TO HOME PAGE</A>/n");
}
把上面的程式編譯後產生CGITEST4.EXE,放在C:/SAMBAR/CGI-BIN目錄下。在瀏覽器的URL處輸入http://localhost:8080/docs/myprogs/bookrec/addbook.htm後執行,在姓名處輸入:Me,在郵箱處輸入:Me@263.net,在留言處填寫:This is realy a nice guest book.按提交後會顯示出:
Your message has been added
SEE GUEST BOOK
RETURN TO HOME PAGE
其中最後的兩行帶有超級連結,點擊SEE GUEST BOOK就可以看到自已的留言。
上面的程式介紹了用TC編寫CGI程式的一般性方法,這些執行個體都是可啟動並執行,但真的要把它們應用於網站建設,則需要進一步的完善,多考慮一些PITFALL,否則會有問題。CGITEST4的問題是輸入的漢字都被編碼為%xx十六進位數的方式(正是由於編碼的結果,CGI程式才能準確地判斷出&#等非法字元的輸入並去除它們),因此,CGI程式必須把合理的%xx換回原有的漢字,否則你在留言薄上看到的是%xx而不是漢字。
更多
http://topic.okbase.net/200506/2005061509/1891477.html