標籤:
前言
每一種該語言在某些極限情況下的表現一般都不太一樣,那麼我常用的Java語言,在達到100萬個並發串連情況下,會怎麼樣呢,有些好奇,更有些期盼。
這次使用經常使用的順手的 netty NIO架構(netty-3.6.5.Final),封裝的很好,介面很全面,就像它現在的網域名稱 netty.io,專註於網路IO。
整個過程沒有什麼技術含量,淺顯分析過就更顯得有些枯燥無聊,準備好,硬著頭皮吧。
測試伺服器配置
運行在VMWare Workstation 9中,64位Centos 6.2系統,分配14.9G記憶體左右,4核。
已安裝有Java7版本:
java version "1.7.0_21"Java(TM) SE Runtime Environment (build 1.7.0_21-b11)Java HotSpot(TM) 64-Bit Server VM (build 23.21-b01, mixed mode)
測試端
測試端和以前一樣的程式,翻看前幾篇部落格就可以看到client5.c的源碼。
在/etc/sysctl.conf中添加如下配置:
fs.file-max = 1048576net.ipv4.ip_local_port_range = 1024 65535net.ipv4.tcp_mem = 786432 2097152 3145728net.ipv4.tcp_rmem = 4096 4096 16777216net.ipv4.tcp_wmem = 4096 4096 16777216net.ipv4.tcp_tw_reuse = 1net.ipv4.tcp_tw_recycle = 1
伺服器程式
這次也是很簡單呐,沒有業務功能,用戶端HTTP請求,服務端輸出chunked編碼內容。
入口HttpChunkedServer.java: 唯一的自訂處理器HttpChunkedServerHandler.java: 啟動指令碼start.sh 達到100萬並發串連時的一些資訊
每次伺服器端達到一百萬個並發持久串連之後,然後關掉測試端程式,斷開所有的串連,等到伺服器端日誌輸出線上使用者為0時,再次重複以上步驟。在這反反覆複的情況下,觀察記憶體等資訊的一些情況。以某次斷開所有測試端為例後,當前系統佔用為(設定為 list_free_1):
total used free shared buffers cached Mem: 15189 7736 7453 0 18 120 -/+ buffers/cache: 7597 7592 Swap: 4095 948 3147
通過top觀察,其進程相關資訊
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 4925 root 20 0 8206m 4.3g 2776 S 0.3 28.8 50:18.66 java
在啟動指令碼start.sh中,我們設定堆記憶體為6G。
ps aux|grep java命令獲得資訊:
root 4925 38.0 28.8 8403444 4484764 ? Sl 15:26 50:18 java -server...HttpChunkedServer 8000
RSS佔用記憶體為4484764K/1024K=4379M
然後再次啟動測試端,在伺服器接收到 online user 1023749時, ps aux|grep java內容為:
root 4925 43.6 28.4 8403444 4422824 ? Sl 15:26 62:53 java -server...
查看當前網路資訊統計
ss -s Total: 1024050 (kernel 1024084) TCP: 1023769 (estab 1023754, closed 2, orphaned 0, synrecv 0, timewait 0/0), ports 12 Transport Total IP IPv6 * 1024084 - - RAW 0 0 0 UDP 7 6 1 TCP 1023767 12 1023755 INET 1023774 18 1023756 FRAG 0 0 0
通過top查看一下
top -p 4925 top - 17:51:30 up 3:02, 4 users, load average: 1.03, 1.80, 1.19 Tasks: 1 total, 0 running, 1 sleeping, 0 stopped, 0 zombie Cpu0 : 0.9%us, 2.6%sy, 0.0%ni, 52.9%id, 1.0%wa, 13.6%hi, 29.0%si, 0.0%st Cpu1 : 1.4%us, 4.5%sy, 0.0%ni, 80.1%id, 1.9%wa, 0.0%hi, 12.0%si, 0.0%st Cpu2 : 1.5%us, 4.4%sy, 0.0%ni, 80.5%id, 4.3%wa, 0.0%hi, 9.3%si, 0.0%st Cpu3 : 1.9%us, 4.4%sy, 0.0%ni, 84.4%id, 3.2%wa, 0.0%hi, 6.2%si, 0.0%st Mem: 15554336k total, 15268728k used, 285608k free, 3904k buffers Swap: 4194296k total, 1082592k used, 3111704k free, 37968k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 4925 root 20 0 8206m 4.2g 2220 S 3.3 28.4 62:53.66 java
四核都被佔用了,每一個核心不太平均。這是在虛擬機器中得到結果,可能真實伺服器會更好一些。 因為不是CPU密集型應用,CPU不是問題,無須多加關注。
系統記憶體狀況
free -m total used free shared buffers cached Mem: 15189 14926 263 0 5 56 -/+ buffers/cache: 14864 324 Swap: 4095 1057 3038
實體記憶體已經無法滿足要求了,佔用了1057M虛擬記憶體。
查看一下堆記憶體情況
jmap -heap 4925 Attaching to process ID 4925, please wait... Debugger attached successfully. Server compiler detected. JVM version is 23.21-b01 using parallel threads in the new generation. using thread-local object allocation. Concurrent Mark-Sweep GC Heap Configuration: MinHeapFreeRatio = 40 MaxHeapFreeRatio = 70 MaxHeapSize = 6442450944 (6144.0MB) NewSize = 629145600 (600.0MB) MaxNewSize = 629145600 (600.0MB) OldSize = 5439488 (5.1875MB) NewRatio = 2 SurvivorRatio = 1 PermSize = 52428800 (50.0MB) MaxPermSize = 52428800 (50.0MB) G1HeapRegionSize = 0 (0.0MB) Heap Usage: New Generation (Eden + 1 Survivor Space): capacity = 419430400 (400.0MB) used = 308798864 (294.49354553222656MB) free = 110631536 (105.50645446777344MB) 73.62338638305664% used Eden Space: capacity = 209715200 (200.0MB) used = 103375232 (98.5863037109375MB) free = 106339968 (101.4136962890625MB) 49.29315185546875% used From Space: capacity = 209715200 (200.0MB) used = 205423632 (195.90724182128906MB) free = 4291568 (4.0927581787109375MB) 97.95362091064453% used To Space: capacity = 209715200 (200.0MB) used = 0 (0.0MB) free = 209715200 (200.0MB) 0.0% used concurrent mark-sweep generation: capacity = 5813305344 (5544.0MB) used = 4213515472 (4018.321487426758MB) free = 1599789872 (1525.6785125732422MB) 72.48054631000646% used Perm Generation: capacity = 52428800 (50.0MB) used = 5505696 (5.250640869140625MB) free = 46923104 (44.749359130859375MB) 10.50128173828125% used 1439 interned Strings occupying 110936 bytes.
老生代佔用記憶體為72%,較為合理,畢竟系統已經處理100萬個串連。
再次斷開所有測試端,看看系統記憶體(free -m)
total used free shared buffers cached Mem: 15189 7723 7466 0 13 120 -/+ buffers/cache: 7589 7599 Swap: 4095 950 3145
記為 list_free_2。
list_free_1和 list_free_2兩次都釋放後的記憶體比較結果,系統可用物理已經記憶體已經降到7589M,先前可是7597M實體記憶體。
總之,我們的JAVA測試程式在記憶體佔用方面已經,最低需要7589 + 950 = 8.6G記憶體為最低需求記憶體吧。
GC日誌
我們在啟動指令碼處設定的一大串參數,到底是否達到目標,還得從gc日誌處獲得具體效果,推薦使用 GCViewer。
GC事件概覽:
其它:
總之:
小結
Java與與Erlang、C相比,比較麻煩的事情,需要在程式一開始就得準備好它的堆棧到底需要多大空間,換個說法就是JVM啟動參數設定堆內 存大小,設定合適的記憶體回收機制,若以後程式需要更多記憶體,需停止程式,編輯啟動參數,然後再次啟動。總之一句話,就是麻煩。單單JVM的調優,就得持續 不斷的根據檢測、資訊、日誌等進行適當微調。
JVM需要提前指定堆大小,相比Erlang/C,這可能是個麻煩
GC(記憶體回收),相對比麻煩,需要持續不斷的根據日誌、JVM堆棧資訊、運行時情況進行JVM參數微調
設定一個最大串連目標,多次測試達到頂峰,然後釋放所有串連,反覆觀察記憶體佔用,獲得一個較為合適的系統運行記憶體值
Eclipse Memory Analyzer結合jmap匯出堆棧DUMP檔案,分析記憶體流失,還是很方便的
想修改運行時內容,或者稱之為熱載入,預設不可能
真實機器上會有更好的反映
吐槽一下:
JAVA OSGI,相對比Erlang來說,需要人轉換思路,不是那麼原生的東西,總是有些彆扭,社區或商業公司對此的修修補補,不過是實現一些物件導向所不具備的熱載入的企業特性。
測試原始碼, 下載just_test。
100萬並發串連伺服器筆記之Java Netty處理1M串連會怎麼樣