一、問題起源
稍大一些的網站,通常都會有好幾個伺服器,每個伺服器運行著不同功能的模組,使用不同的次層網域,而一個整體性強的網站,使用者系統是統一的,即一套使用者名稱、密碼在整個網站的各個模組中都是可以登入使用的。各個伺服器共用使用者資料是比較容易實現的,只需要在後端放個資料庫伺服器,各個伺服器通過統一介面對使用者資料進行訪問即可。但還存在一個問題,就是使用者在這個伺服器登入之後,進入另一個伺服器的別的模組時,仍然需要重新登入,這就是一次登入,全部通行的問題,映射到技術上,其實就是各個伺服器之間如何?共用 SESSION 資料的問題。
二、PHP SESSION 的工作原理
在解決問題之前,先來瞭解一下 PHP SESSION 的工作原理。在用戶端(如瀏覽器)登入網站時,被訪問的 PHP 頁面可以使用 session_start() 開啟 SESSION,這樣就會產生用戶端的唯一標識 SESSION ID(此 ID 可通過函數 session_id() 擷取/設定)。SESSION ID 可以通過兩種方式保留在用戶端,使得請求不同的頁面時,PHP 程式可以獲知用戶端的 SESSION ID;一種是將 SESSION ID 自動加入到 GET 的 URL 中,或者 POST 的表單中,預設情況下,變數名為 PHPSESSID;另一種是通過 COOKIE,將 SESSION ID 儲存在 COOKIE 中,預設情況下,這個 COOKIE 的名字為 PHPSESSID。這裡我們主要以 COOKIE 方式進行說明,因為應用比較廣泛。
那麼 SESSION 的資料儲存在哪裡呢?當然是在伺服器端,但不是儲存在記憶體中,而是儲存在檔案或資料庫中。預設情況下,php.ini 中設定的 SESSION 儲存方式是 files(session.save_handler = files),即使用讀寫檔案的方式儲存 SESSION 資料,而 SESSION 檔案儲存的目錄由 session.save_path 指定,檔案名稱以 sess_ 為首碼,後跟 SESSION ID,如:sess_c72665af28a8b14c0fe11afe3b59b51b。檔案中的資料即是序列化之後的 SESSION 資料了。如果訪問量大,可能產生的 SESSION 檔案會比較多,這時可以設定分級目錄進行 SESSION 檔案的儲存,效率會提高很多,設定方法為:session.save_path="N;/save_path",N 為分級的級數,save_path 為開始目錄。當寫入 SESSION 資料的時候,PHP 會擷取到用戶端的 SESSION_ID,然後根據這個 SESSION ID 到指定的 SESSION 檔案儲存目錄中找到相應的 SESSION 檔案,不存在則建立之,最後將資料序列化之後寫入檔案。讀取 SESSION 資料是也是類似的操作流程,對讀出來的資料需要進行解序列化,產生相應的 SESSION 變數。
三、多伺服器共用 SESSION 的主要障礙及解決辦法
通過瞭解 SESSION 的工作原理,我們可以發現,在預設情況下,各個伺服器會各自分別對同一個用戶端產生 SESSION ID,如對於同一個使用者瀏覽器,A 伺服器產生的 SESSION ID 是 30de1e9de3192ba6ce2992d27a1b6a0a,而 B 伺服器產生的則是 c72665af28a8b14c0fe11afe3b59b51b。另外,PHP 的 SESSION 資料都是分別儲存在本伺服器的檔案系統中。