標籤:多線程 randomaccessfile http 下載 序列化
本篇部落格可認為是對 使用java實現http多線程下載 一文的再次解讀。
首先,從宏觀來說
java實現多線程下載這個功能的實現由以下幾部分組成:
1 建立多個線程去分別下載檔案的一部分。
2 將多個線程下載的檔案(還在記憶體中),寫入硬碟中的一個檔案。
3 斷點續傳
GET /Path/FileName HTTP/1.0
Host: www.server.com:80
Accept: */*
User-Agent: GeneralDownloadApplication
Connection: close
這就是一個request請求
例如host,accept都是request請求的欄位部分(關於ruquest的詳盡資訊 可參考 HTTP深入淺出 http請求
首先我們說第一點:
如果某個檔案有1000位元組
在request的欄位部分裡,加入Range
Range: bytes=500- 表示讀取該檔案的500-999位元組,共500位元組。
Range: bytes=500-599 表示讀取該檔案的500-599位元組,共100位元組。
這樣第一個問題就算是解決了。
這裡其實還有一個小問題
如果一個檔案大小為123kB
用10個線程下載
怎麼辦? 123除以10 除不盡呀。
咱們可以讓 前9個線程都下載12KB資料
第10個線程下載15KB 不就OK了!!
這部分代碼怎麼寫?自己看著辦。
第二個問題牽扯到,在一個檔案中的給定位置寫資料。
有這個一個類: RandomAccessFile
Random 隨機
Access 訪問
這個類大家猜一猜,都知道就是隨機訪問檔案的。
我們看看它的幾個方法。
public native void seek(long pos) throws IOException * @param b the data. * @param off the start offset in the data. * @param len the number of bytes to write. * @exception IOException if an I/O error occurs.public void write(byte b[], int off, int len) throws IOException
第一個方法就是定位,pos就是檔案的某一個位置。
第二個方法就是.. 自己看說明吧。
關於RandomAccessFile的例子大家參考 Java RandomAccessFile用法
那第三個問題如何解決呢?
系統中有一個類是:DLTask,代表一個下載任務(一個下載任務裡面會通過多個線程來下載那一個檔案)
系統中會有一個單獨的線程來監控下載任務,每隔3秒,就會把下載任務(java類)序列化的硬碟上。
這樣一來即使在下載未完成時,終止下載。下一次,我們依然可以通過還原序列化得到原先的下載任務。(關於序列化的知識 請參看 Java基礎學習總結——Java對象的序列化和還原序列化
同時那個專門監控下載任務的進程還可以統計下載速率。
參考資料
http://www.cnblogs.com/rqnet/p/4319587.html
http://calmness.iteye.com/blog/220075
http://www.cnblogs.com/yin-jingyu/archive/2011/08/01/2123548.html
http://blog.csdn.net/akon_vm/article/details/7429245
http://www.cnblogs.com/xdp-gacl/p/3777987.html
java實現多線程下載