摘要:與傳統模式的區別之一則是服務器不是直接執行程序了,而是通過與響應器進程管理器進行交互,服務器需要將接口數據封裝在遵循協議包中發送給響應器程序。正是由于進程管理器是基于通信的,所以也是分布式的,服務器和響應器服務器分開部署。
廣告
很多工程師在工作1~3年的時候最容易遇到瓶頸,不知道自己應該學習什么,面試總是吃閉門羹。那么 PHP 后面應該怎么學呢?安利一波我的系列直播 《PHP 進階之路》
在討論 FastCGI 之前,不得不說傳統的 CGI 的工作原理,同時應該大概了解 CGI 1.1 協議
傳統 CGI 工作原理分析客戶端訪問某個 URL 地址之后,通過 GET/POST/PUT 等方式提交數據,并通過 HTTP 協議向 Web 服務器發出請求,服務器端的 HTTP Daemon(守護進程)將 HTTP 請求里描述的信息通過標準輸入 stdin 和環境變量(environment variable)傳遞給主頁指定的 CGI 程序,并啟動此應用程序進行處理(包括對數據庫的處理),處理結果通過標準輸出 stdout 返回給 HTTP Daemon 守護進程,再由 HTTP Daemon 進程通過 HTTP 協議返回給客戶端。
上面的這段話理解可能還是比較抽象,下面我們就通過一次GET請求為例進行詳細說明。
下面用代碼來實現圖中表述的功能。Web 服務器啟動一個 socket 監聽服務,然后在本地執行 CGI 程序。后面有比較詳細的代碼解讀。
#include如上代碼中的重點:#include #include #include #include #include #include #include #define SERV_PORT 9003 char* str_join(char *str1, char *str2); char* html_response(char *res, char *buf); int main(void) { int lfd, cfd; struct sockaddr_in serv_addr,clin_addr; socklen_t clin_len; char buf[1024],web_result[1024]; int len; FILE *cin; if((lfd = socket(AF_INET,SOCK_STREAM,0)) == -1){ perror("create socket failed"); exit(1); } memset(&serv_addr, 0, sizeof(serv_addr)); serv_addr.sin_family = AF_INET; serv_addr.sin_addr.s_addr = htonl(INADDR_ANY); serv_addr.sin_port = htons(SERV_PORT); if(bind(lfd, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1) { perror("bind error"); exit(1); } if(listen(lfd, 128) == -1) { perror("listen error"); exit(1); } signal(SIGCLD,SIG_IGN); while(1) { clin_len = sizeof(clin_addr); if ((cfd = accept(lfd, (struct sockaddr *)&clin_addr, &clin_len)) == -1) { perror("接收錯誤 "); continue; } cin = fdopen(cfd, "r"); setbuf(cin, (char *)0); fgets(buf,1024,cin); //讀取第一行 printf(" %s", buf); //============================ cgi 環境變量設置演示 ============================ // 例如 "GET /user.cgi?id=1 HTTP/1.1"; char *delim = " "; char *p; char *method, *filename, *query_string; char *query_string_pre = "QUERY_STRING="; method = strtok(buf,delim); // GET p = strtok(NULL,delim); // /user.cgi?id=1 filename = strtok(p,"?"); // /user.cgi if (strcmp(filename,"/favicon.ico") == 0) { continue; } query_string = strtok(NULL,"?"); // id=1 putenv(str_join(query_string_pre,query_string)); //============================ cgi 環境變量設置演示 ============================ int pid = fork(); if (pid > 0) { close(cfd); } else if (pid == 0) { close(lfd); FILE *stream = popen(str_join(".",filename),"r"); fread(buf,sizeof(char),sizeof(buf),stream); html_response(web_result,buf); write(cfd,web_result,sizeof(web_result)); pclose(stream); close(cfd); exit(0); } else { perror("fork error"); exit(1); } } close(lfd); return 0; } char* str_join(char *str1, char *str2) { char *result = malloc(strlen(str1)+strlen(str2)+1); if (result == NULL) exit (1); strcpy(result, str1); strcat(result, str2); return result; } char* html_response(char *res, char *buf) { char *html_response_template = "HTTP/1.1 200 OK Content-Type:text/html Content-Length: %d Server: mengkang %s"; sprintf(res,html_response_template,strlen(buf),buf); return res; }
66~81行找到CGI程序的相對路徑(我們為了簡單,直接將其根目錄定義為Web程序的當前目錄),這樣就可以在子進程中執行 CGI 程序了;同時設置環境變量,方便CGI程序運行時讀取;
94~95行將 CGI 程序的標準輸出結果寫入 Web 服務器守護進程的緩存中;
97行則將包裝后的 html 結果寫入客戶端 socket 描述符,返回給連接Web服務器的客戶端。
CGI 程序(user.c)#include#include // 通過獲取的 id 查詢用戶的信息 int main(void){ //============================ 模擬數據庫 ============================ typedef struct { int id; char *username; int age; } user; user users[] = { {}, { 1, "mengkang.zhou", 18 } }; //============================ 模擬數據庫 ============================ char *query_string; int id; query_string = getenv("QUERY_STRING"); if (query_string == NULL) { printf("沒有輸入數據"); } else if (sscanf(query_string,"id=%d",&id) != 1) { printf("沒有輸入id"); } else { printf("用戶信息查詢
學號: %d
姓名: %s
年齡: %d",id,users[id].username,users[id].age); } return 0; }
將上面的 CGI 程序編譯成gcc user.c -o user.cgi,放在上面web程序的同級目錄。
代碼中的第28行,從環境變量中讀取前面在Web服務器守護進程中設置的環境變量,是我們演示的重點。
相對于 CGI/1.1 規范在 Web 服務器在本地 fork 一個子進程執行 CGI 程序,填充 CGI 預定義的環境變量,放入系統環境變量,把 HTTP body 體的 content 通過標準輸入傳入子進程,處理完畢之后通過標準輸出返回給 Web 服務器。FastCGI 的核心則是取締傳統的 fork-and-execute 方式,減少每次啟動的巨大開銷(后面以 PHP 為例說明),以常駐的方式來處理請求。
FastCGI 工作流程如下:
FastCGI 進程管理器自身初始化,啟動多個 CGI 解釋器進程,并等待來自 Web Server 的連接。
Web 服務器與 FastCGI 進程管理器進行 Socket 通信,通過 FastCGI 協議發送 CGI 環境變量和標準輸入數據給 CGI 解釋器進程。
CGI 解釋器進程完成處理后將標準輸出和錯誤信息從同一連接返回 Web Server。
CGI 解釋器進程接著等待并處理來自 Web Server 的下一個連接。
FastCGI 與傳統 CGI 模式的區別之一則是 Web 服務器不是直接執行 CGI 程序了,而是通過 socket 與 FastCGI 響應器(FastCGI 進程管理器)進行交互,Web 服務器需要將 CGI 接口數據封裝在遵循 FastCGI 協議包中發送給 FastCGI 響應器程序。正是由于 FastCGI 進程管理器是基于 socket 通信的,所以也是分布式的,Web服務器和CGI響應器服務器分開部署。
再啰嗦一句,FastCGI 是一種協議,它是建立在CGI/1.1基礎之上的,把CGI/1.1里面的要傳遞的數據通過FastCGI協議定義的順序、格式進行傳遞。
準備工作可能上面的內容理解起來還是很抽象,這是由于第一對FastCGI協議還沒有一個大概的認識,第二沒有實際代碼的學習。所以需要預先學習下 FastCGI 協議的內容,不一定需要完全看懂,可大致了解之后,看完本篇再結合著學習理解消化。
FastCGI 協議分析http://www.fastcgi.com/devkit... (英文原版)
http://andylin02.iteye.com/bl... (中文版)
下面結合 PHP 的 FastCGI 的代碼進行分析,不作特殊說明以下代碼均來自于 PHP 源碼。
FastCGI 消息類型FastCGI 將傳輸的消息做了很多類型的劃分,其結構體定義如下:
typedef enum _fcgi_request_type { FCGI_BEGIN_REQUEST = 1, /* [in] */ FCGI_ABORT_REQUEST = 2, /* [in] (not supported) */ FCGI_END_REQUEST = 3, /* [out] */ FCGI_PARAMS = 4, /* [in] environment variables */ FCGI_STDIN = 5, /* [in] post data */ FCGI_STDOUT = 6, /* [out] response */ FCGI_STDERR = 7, /* [out] errors */ FCGI_DATA = 8, /* [in] filter data (not supported) */ FCGI_GET_VALUES = 9, /* [in] */ FCGI_GET_VALUES_RESULT = 10 /* [out] */ } fcgi_request_type;消息的發送順序
下圖是一個簡單的消息傳遞流程
最先發送的是FCGI_BEGIN_REQUEST,然后是FCGI_PARAMS和FCGI_STDIN,由于每個消息頭(下面將詳細說明)里面能夠承載的最大長度是65535,所以這兩種類型的消息不一定只發送一次,有可能連續發送多次。
FastCGI 響應體處理完畢之后,將發送FCGI_STDOUT、FCGI_STDERR,同理也可能多次連續發送。最后以FCGI_END_REQUEST表示請求的結束。
需要注意的一點,FCGI_BEGIN_REQUEST和FCGI_END_REQUEST分別標識著請求的開始和結束,與整個協議息息相關,所以他們的消息體的內容也是協議的一部分,因此也會有相應的結構體與之對應(后面會詳細說明)。而環境變量、標準輸入、標準輸出、錯誤輸出,這些都是業務相關,與協議無關,所以他們的消息體的內容則無結構體對應。
由于整個消息是二進制連續傳遞的,所以必須定義一個統一的結構的消息頭,這樣以便讀取每個消息的消息體,方便消息的切割。這在網絡通訊中是非常常見的一種手段。
FastCGI 消息頭如上,FastCGI 消息分10種消息類型,有的是輸入有的是輸出。而所有的消息都以一個消息頭開始。其結構體定義如下:
typedef struct _fcgi_header { unsigned char version; unsigned char type; unsigned char requestIdB1; unsigned char requestIdB0; unsigned char contentLengthB1; unsigned char contentLengthB0; unsigned char paddingLength; unsigned char reserved; } fcgi_header;
字段解釋下:
version標識FastCGI協議版本。
type 標識FastCGI記錄類型,也就是記錄執行的一般職能。
requestId標識記錄所屬的FastCGI請求。
contentLength記錄的contentData組件的字節數。
關于上面的xxB1和xxB0的協議說明:當兩個相鄰的結構組件除了后綴“B1”和“B0”之外命名相同時,它表示這兩個組件可視為估值為B1<<8 + B0的單個數字。該單個數字的名字是這些組件減去后綴的名字。這個約定歸納了一個由超過兩個字節表示的數字的處理方式。
比如協議頭中requestId和contentLength表示的最大值就是65535
#include#include #include int main() { unsigned char requestIdB1 = UCHAR_MAX; unsigned char requestIdB0 = UCHAR_MAX; printf("%d ", (requestIdB1 << 8) + requestIdB0); // 65535 }
你可能會想到如果一個消息體長度超過65535怎么辦,則分割為多個相同類型的消息發送即可。
FCGI_BEGIN_REQUEST 的定義typedef struct _fcgi_begin_request { unsigned char roleB1; unsigned char roleB0; unsigned char flags; unsigned char reserved[5]; } fcgi_begin_request;
字段解釋
role表示Web服務器期望應用扮演的角色。分為三個角色(而我們這里討論的情況一般都是響應器角色)
typedef enum _fcgi_role { FCGI_RESPONDER = 1, FCGI_AUTHORIZER = 2, FCGI_FILTER = 3 } fcgi_role;
而FCGI_BEGIN_REQUEST中的flags組件包含一個控制線路關閉的位:flags & FCGI_KEEP_CONN:如果為0,則應用在對本次請求響應后關閉線路。如果非0,應用在對本次請求響應后不會關閉線路;Web服務器為線路保持響應性。
FCGI_END_REQUEST 的定義typedef struct _fcgi_end_request { unsigned char appStatusB3; unsigned char appStatusB2; unsigned char appStatusB1; unsigned char appStatusB0; unsigned char protocolStatus; unsigned char reserved[3]; } fcgi_end_request;
字段解釋
appStatus組件是應用級別的狀態碼。
protocolStatus組件是協議級別的狀態碼;protocolStatus的值可能是:
FCGI_REQUEST_COMPLETE:請求的正常結束。
FCGI_CANT_MPX_CONN:拒絕新請求。這發生在Web服務器通過一條線路向應用發送并發的請求時,后者被設計為每條線路每次處理一個請求。
FCGI_OVERLOADED:拒絕新請求。這發生在應用用完某些資源時,例如數據庫連接。
FCGI_UNKNOWN_ROLE:拒絕新請求。這發生在Web服務器指定了一個應用不能識別的角色時。
protocolStatus在 PHP 中的定義如下
typedef enum _fcgi_protocol_status { FCGI_REQUEST_COMPLETE = 0, FCGI_CANT_MPX_CONN = 1, FCGI_OVERLOADED = 2, FCGI_UNKNOWN_ROLE = 3 } dcgi_protocol_status;
需要注意dcgi_protocol_status和fcgi_role各個元素的值都是 FastCGI 協議里定義好的,而非 PHP 自定義的。
消息通訊樣例為了簡單的表示,消息頭只顯示消息的類型和消息的 id,其他字段都不予以顯示。下面的例子來自于官網
{FCGI_BEGIN_REQUEST, 1, {FCGI_RESPONDER, 0}} {FCGI_PARAMS, 1, "