關鍵字: web
需求:前段時間做的公司內部網站,需要一個portal頁面。其中的message center模組會顯示出公司其他應用程式產生的待審批記錄或者其他和partner相關的內容。因為要避免直接用url redirect過去(不能在url上顯示使用者名稱和密碼的明文,比較銼的單點登入)。這就要求把登入資訊放到post請求體當中去。
先從session狀態的保持說起:
一、術語session
session在web開發語境下的語義,它的含義是指一類用來在用戶端與伺服器之間保持狀態的解決方案。有時候session也用來指這種解決方案的儲存結構,如“把xxx儲存在session裡”。由於各種用於web開發的語言在一定程度上都提供了對這種解決方案的支援,所以在某種特定語言的語境下,session也被用來指代該語言的解決方案,比如經常把Java裡提供的 javax.servlet.http.HttpSession簡稱為session。
二、HTTP協議與狀態保持
HTTP協議本身是無狀態的,這與HTTP協議本來的目的是相符的,用戶端只需要簡單的向伺服器請求下載某些檔案,無論是用戶端還是伺服器都沒有必要紀錄彼此過去的行為,每一次請求之間都是獨立的,好比一個顧客和一個自動售貨機或者一個普通的(非會員制)大賣場之間的關係一樣。
然而聰明(或者貪心?)的人們很快發現如果能夠提供一些按需產生的動態資訊會使web變得更加有用。其中cookie的作用就是為瞭解決HTTP協議無狀態的缺陷所作出的努力。至於後來出現的session機制則是又一種在用戶端與伺服器之間保持狀態的解決方案。
讓我們用幾個例子來描述一下cookie和session機制之間的區別與聯絡。筆者曾經常去的一家咖啡店有喝5杯咖啡免費贈一杯咖啡的優惠,然而一次性消費5杯咖啡的機會微乎其微,這時就需要某種方式來紀錄某位顧客的消費數量。想象一下其實也無外乎下面的幾種方案:
1、該店的店員很厲害,能記住每位顧客的消費數量,只要顧客一走進咖啡店,店員就知道該怎麼對待了。這種做法就是協議本身支援狀態。
2、發給顧客一張卡片,上面記錄著消費的數量,一般還有個有效期間限。每次消費時,如果顧客出示這張卡片,則此次消費就會與以前或以後的消費相聯絡起來。這種做法就是在用戶端保持狀態。
3、發給顧客一張會員卡,除了卡號之外什麼資訊也不紀錄,每次消費時,如果顧客出示該卡片,則店員在店裡的紀錄本上找到這個卡號對應的紀錄添加一些消費資訊。這種做法就是在伺服器端保持狀態。
由於HTTP協議是無狀態的,而出於種種考慮也不希望使之成為有狀態的,因此,後面兩種方案就成為現實的選擇。具體來說cookie機制採用的是在用戶端保持狀態的方案,而session機制採用的是在伺服器端保持狀態的方案。同時我們也看到,由於採用伺服器端保持狀態的方案在用戶端也需要儲存一個標識,所以session機制可能需要藉助於cookie機制來達到儲存標識的目的,但實際上它還有其他選擇。
三、理解cookie機制
cookie機制的基本原理就如上面的例子一樣簡單,但是還有幾個問題需要解決:“會員卡”如何分發;“會員卡”的內容;以及客戶如何使用“會員卡”。
正統的cookie分發是通過擴充HTTP協議來實現的,伺服器通過在HTTP的回應標頭中加上一行特殊的指示以提示瀏覽器按照指示產生相應的cookie。然而純粹的用戶端指令碼如JavaScript或者VBScript也可以產生cookie。
而cookie的使用是由瀏覽器按照一定的原則在後台自動發送給伺服器的。瀏覽器檢查所有儲存的cookie,如果某個cookie所聲明的作用範圍大於等於將要請求的資源所在的位置,則把該cookie附在請求資源的HTTP要求標頭上發送給伺服器。意思是麥當勞的會員卡只能在麥當勞的店裡出示,如果某家分店還發行了自己的會員卡,那麼進這家店的時候除了要出示麥當勞的會員卡,還要出示這家店的會員卡。
cookie的內容主要包括:名字(name),值(value),到期時間,路徑(path)和域(domain)。domain和path 決定了cookie可以使用的範圍,所以在瀏覽器端cookie可以是重名的。
其中域可以指定某一個域比如.google.com,相當於總店招牌,比如寶潔公司,也可以指定一個域下的具體某台機器比如www.google.com或者froogle.google.com,可以用飄柔來做比。
路徑就是跟在網域名稱後面的URL路徑,比如/或者/foo等等,可以用某飄柔專櫃做比。
路徑與域合在一起就構成了cookie的作用範圍。
如果不設定到期時間,則表示這個cookie的生命期為瀏覽器會話期間,只要關閉瀏覽器視窗,cookie就消失了。這種生命期為瀏覽器會話期的cookie被稱為會話cookie。會話cookie一般不儲存在硬碟上而是儲存在記憶體裡,當然這種行為並不是規範規定的。如果設定了到期時間,瀏覽器就會把cookie儲存到硬碟上,關閉後再次開啟瀏覽器,這些cookie仍然有效直到超過設定的到期時間。
儲存在硬碟上的cookie可以在不同的瀏覽器進程間共用,比如兩個IE視窗。而對於儲存在記憶體裡的cookie,不同的瀏覽器有不同的處理方式。對於IE,在一個開啟的視窗上按Ctrl-N(或者從檔案菜單)開啟的視窗可以與原視窗共用,而使用其他方式新開的IE進程則不能共用已經開啟的視窗的記憶體cookie;對於Mozilla Firefox0.8,所有的進程和標籤頁都可以共用同樣的cookie。一般來說是用javascript的window.open開啟的視窗會與原視窗共用記憶體cookie。瀏覽器對於會話cookie的這種只認cookie不認人的處理方式經常給採用session機制的web應用程式開發人員造成很大的困擾。
下面就是一個goolge設定cookie的回應標頭的例子
HTTP/1.1 302 Found
Location: http://www.google.com/intl/zh-CN/
Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:S=KaeaCFPo49RiA_d8; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
Content-Type: text/html
四、理解session機制
session機制是一種伺服器端的機制,伺服器使用一種類似於散列表的結構(也可能就是使用散列表)來儲存資訊。
當程式需要為某個用戶端的請求建立一個session的時候,伺服器首先檢查這個用戶端的請求裡是否已包含了一個session標識 - 稱為session id,如果已包含一個session id則說明以前已經為此用戶端建立過session,伺服器就按照session id把這個session檢索出來使用(如果檢索不到,可能會建立一個),如果用戶端請求不包含session id,則為此用戶端建立一個session並且產生一個與此session相關聯的session id,session id的值應該是一個既不會重複,又不容易被找到規律以仿造的字串,這個session id將被在本次響應中返回給用戶端儲存。
儲存這個session id的方式可以採用cookie,這樣在互動過程中瀏覽器可以自動的按照規則把這個標識發揮給伺服器。一般這個cookie的名字都是類似於 SEEESIONID,而。比如weblogic對於web應用程式產生的 cookie,JSESSIONID=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764,它的名字就是JSESSIONID。
由於cookie可以被人為的禁止,必須有其他機制以便在cookie被禁止時仍然能夠把session id傳遞迴伺服器。經常被使用的一種技術叫做URL重寫,就是把session id直接附加在URL路徑的後面,附加方式也有兩種,一種是作為URL路徑的附加資訊,表現形式為http://..... /xxx;jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 另一種是作為查詢字串附加在URL後面,表現形式為http://..... /xxx?jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764
這兩種方式對於使用者來說是沒有區別的,只是伺服器在解析的時候處理的方式不同,採用第一種方式也有利於把session id的資訊和正常程式參數區分開來。
為了在整個互動過程中始終保持狀態,就必須在每個用戶端可能請求的路徑後面都包含這個session id。
另一種技術叫做表單隱藏欄位。就是伺服器會自動修改表單,添加一個隱藏欄位,以便在表單提交時能夠把session id傳遞迴伺服器。比如下面的表單
<form name="testform" action="/xxx">
<input type="text">
</form>
在被傳遞給用戶端之前將被改寫成
<form name="testform" action="/xxx">
<input type="hidden" name="jsessionid" value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764">
<input type="text">
</form>
這種技術現在已較少應用,筆者接觸過的很古老的iPlanet6(SunONE應用伺服器的前身)就使用了這種技術。實際上這種技術可以簡單的用對action應用URL重寫來代替。
在談論session機制的時候,常常聽到這樣一種誤解“只要關閉瀏覽器,session就消失了”。其實可以想象一下會員卡的例子,除非顧客主動對店家提出銷卡,否則店家絕對不會輕易刪除顧客的資料。對session來說也是一樣的,除非程式通知伺服器刪除一個session,否則伺服器會一直保留,程式一般都是在使用者做log off的時候發個指令去刪除session。然而瀏覽器從來不會主動在關閉之前通知伺服器它將要關閉,因此伺服器根本不會有機會知道瀏覽器已經關閉,之所以會有這種錯覺,是大部分session機制都使用會話cookie來儲存session id,而關閉瀏覽器後這個session id就消失了,再次串連伺服器時也就無法找到原來的session。如果伺服器設定的cookie被儲存到硬碟上,或者使用某種手段改寫瀏覽器發出的 HTTP要求標頭,把原來的session id發送給伺服器,則再次開啟瀏覽器仍然能夠找到原來的session。
恰恰是由於關閉瀏覽器不會導致session被刪除,迫使伺服器為seesion設定了一個失效時間,當距離用戶端上一次使用session的時間超過這個失效時間時,伺服器就可以認為用戶端已經停止了活動,才會把session刪除以節省儲存空間。
五、理解javax.servlet.http.HttpSession
HttpSession是Java平台對session機制的實現規範,因為它僅僅是個介面,具體到每個web應用伺服器的供應商,除了對規範支援之外,仍然會有一些規範裡沒有規定的細微差異。
一般情況下,session都是儲存在記憶體裡,當伺服器處理序被停止或者重啟的時候,記憶體裡的session也會被清空,如果設定了 session的持久化特性,伺服器就會把session儲存到硬碟上,當伺服器處理序重新啟動或這些資訊將能夠被再次使用。
複製嚴格說來不算持久化儲存,因為session實際上還是儲存在記憶體裡,不過同樣的資訊被複製到各個cluster內的伺服器處理序中,這樣即使某個伺服器處理序停止工作也仍然可以從其他進程中取得session。
cookie存留時間的設定則會影響瀏覽器產生的cookie是否是一個會話cookie。預設是使用會話cookie。有興趣的可以用它來實驗我們在第四節裡提到的那個誤解。
六、HttpSession常見問題
1、session在何時被建立
一個常見的誤解是以為session在有用戶端訪問時就被建立,然而事實是直到某server端程式調用 HttpServletRequest.getSession(true)這樣的語句時才被建立,注意如果JSP沒有顯示的使用 <%@page session="false"%> 關閉session,則JSP檔案在編譯成Servlet時將會自動加上這樣一條語句HttpSession session = HttpServletRequest.getSession(true);這也是JSP中隱含的session對象的來曆。
由於session會消耗記憶體資源,因此,如果不打算使用session,應該在所有的JSP中關閉它。
2、session何時被刪除
綜合前面的討論,session在下列情況下被刪除a.程式調用HttpSession.invalidate();或b.距離上一次收到用戶端發送的session id時間間隔超過了session的逾時設定;或c.伺服器處理序被停止(非持久session)
3、如何做到在瀏覽器關閉時刪除session
嚴格的講,做不到這一點。可以做一點努力的辦法是在所有的用戶端頁面裡使用javascript代碼window.oncolose來監視瀏覽器的關閉動作,然後向伺服器發送一個請求來刪除session。但是對於瀏覽器崩潰或者強行殺死進程這些非常規手段仍然無能為力。
4、有個HttpSessionListener是怎麼回事
你可以建立這樣的listener去監控session的建立和銷毀事件,使得在發生這樣的事件時你可以做一些相應的工作。注意是 session的建立和銷毀動作觸發listener,而不是相反。類似的與HttpSession有關的listener還有 HttpSessionBindingListener,HttpSessionActivationListener和 HttpSessionAttributeListener。
5、存放在session中的對象必須是可序列化的嗎
不是必需的。要求對象可序列化只是為了session能夠在叢集中被複製或者能夠持久儲存或者在必要時server能夠暫時把session交換出記憶體。在Weblogic Server的session中放置一個不可序列化的對象在控制台上會收到一個警告。我所用過的某個iPlanet版本如果session中有不可序列化的對象,在session銷毀時會有一個Exception,很奇怪。
6、如何才能正確的應付用戶端禁止cookie的可能性
對所有的URL使用URL重寫,包括超連結,form的action,和重新導向的URL,具體做法參見[6]
http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770
7、開兩個瀏覽器視窗訪問應用程式會使用同一個session還是不同的session
參見第三小節對cookie的討論,對session來說是只認id不認人,因此不同的瀏覽器,不同的視窗開啟檔案以及不同的cookie儲存方式都會對這個問題的答案有影響。
8、如何防止使用者開啟兩個瀏覽器視窗操作導致的session混亂
這個問題與防止表單多次提交是類似的,可以通過設定用戶端的令牌來解決。就是在伺服器每次產生一個不同的id返回給用戶端,同時儲存在 session裡,用戶端提交表單時必須把這個id也返回伺服器,程式首先比較返回的id與儲存在session裡的值是否一致,如果不一致則說明本次操作已經被提交過了。可以參看《J2EE核心模式》關於展示層模式的部分。需要注意的是對於使用javascript window.open開啟的視窗,一般不設定這個id,或者使用單獨的id,以防主視窗無法操作,建議不要再window.open開啟的視窗裡做修改操作,這樣就可以不用設定。
10、為什麼session不見了
排除session正常失效的因素之外,伺服器本身的可能性應該是微乎其微的,雖然筆者在iPlanet6SP1加若干補丁的Solaris版本上倒也遇到過;瀏覽器外掛程式的可能性次之,筆者也遇到過3721外掛程式造成的問題;理論上防火牆或者Proxy 伺服器在cookie處理上也有可能會出現問題。
出現這一問題的大部分原因都是程式的錯誤,最常見的就是在一個應用程式中去訪問另外一個應用程式。我們在下一節討論這個問題。