2012 野比 conmajia@gmail.com
寫在前面的話:
本文針對GDI+下Bitmap操作(Get/SetPixel)進行測試,而非尋求最快速的位元影像處理方式。如果你需要速度上的提升,請使用GDI+以外的技術,如並行計算、調用MMX/SSE指令、CUDA等。
這是一個古老的技巧:
使用Bitmap類時經常會用到GetPixel和SetPixel,但是這兩個方法直接使用都比較慢,所以一般都會使用LockBits/UnlockBits將位元影像在記憶體中鎖定,以加快操作速度。
MSDN上的標準參考是這樣的:
MSDN樣本:鎖定記憶體後拷貝
1 private void LockUnlockBitsExample(PaintEventArgs e) 2 { 3 4 // Create a new bitmap.建立位元影像 5 Bitmap bmp = new Bitmap("c:\\fakePhoto.jpg"); 6 7 // Lock the bitmap's bits. 鎖定位元影像 8 Rectangle rect = new Rectangle(0, 0, bmp.Width, bmp.Height); 9 System.Drawing.Imaging.BitmapData bmpData =10 bmp.LockBits(rect, System.Drawing.Imaging.ImageLockMode.ReadWrite,11 bmp.PixelFormat);12 13 // Get the address of the first line.擷取首行地址14 IntPtr ptr = bmpData.Scan0;15 16 // Declare an array to hold the bytes of the bitmap.定義數組儲存位元影像17 int bytes = Math.Abs(bmpData.Stride) * bmp.Height;18 byte[] rgbValues = new byte[bytes];19 20 // Copy the RGB values into the array.複製RGB值到數組21 System.Runtime.InteropServices.Marshal.Copy(ptr, rgbValues, 0, bytes);22 23 // Set every third value to 255. A 24bpp bitmap will look red. 把每像素第3個值設為255.24bpp的位元影像將變紅24 for (int counter = 2; counter < rgbValues.Length; counter += 3)25 rgbValues[counter] = 255;26 27 // Copy the RGB values back to the bitmap 把RGB值拷回位元影像28 System.Runtime.InteropServices.Marshal.Copy(rgbValues, 0, ptr, bytes);29 30 // Unlock the bits.解鎖31 bmp.UnlockBits(bmpData);32 33 // Draw the modified image.繪製更新了的位元影像34 e.Graphics.DrawImage(bmp, 0, 150);35 }
用指標法會更快,所以你看到的實際代碼,一般是類似這樣的:
1 unsafe public Color GetPixel(int x, int y) 2 { 3 if (this.bmpData.PixelFormat == PixelFormat.Format32bppArgb) 4 { 5 byte* numPtr = (byte*) ((((void*) this.bmpData.Scan0) + (y * this.bmpData.Stride)) + (x * 4)); 6 return Color.FromArgb(numPtr[3], numPtr[2], numPtr[1], numPtr[0]); 7 } 8 if (this.bmpData.PixelFormat == PixelFormat.Format24bppRgb) 9 {10 byte* numPtr2 = (byte*) ((((void*) this.bmpData.Scan0) + (y * this.bmpData.Stride)) + (x * 3));11 return Color.FromArgb(numPtr2[2], numPtr2[1], numPtr2[0]);12 }13 return Color.Empty;14 }
因為我比較閑,所以我在想這樣的問題:加快之後到底有多快?
為此,我稍微調整了下之前用過的BitmapEx類(記得應該是Face Service還是什麼代碼裡用過),改成FastBitmap,然後建立了測試程式,搜集了一系列測試案例。(點擊左片框開啟圖片檔案,無異常處理)
測試機配置如下:
測試案例如下:
為了保證不受檔案格式影響,統一使用24bpp的bmp格式。(感謝科技發展,記憶體白菜價,不然單個檔案將近200MB可真要讓我麻煩一番。)
考察分為GetPixel和SetPixel兩個部分,把讀寫分開。測試代碼(以GetPixel為例)非常簡單,遍曆位元影像上每個像素點,如下:
1 for (int y = 0; y < h; y++)2 {3 for (int x = 0; x < w; x++)4 {5 tmp = bmp.GetPixel(x, y);6 }7 }
其中bmp分別為Bitmap和FastBitmap。
為了專註於對比結果,雖然逐像素遍曆映像非常耗費時間,但並沒有刻意使用並行計算,使用單個CPU核心完成。所以如果你打算用這個程式對特別巨大的圖片(10000×10000數量級以上)進行測試,還請謹慎。
最後,得到了這樣的測試記錄:
從測試結果來看,使用指標後,平均提升效率在90%~95%,也就說效能提高了10~20倍。
這個結果,雖然還不算很快,但我覺得基本到了GDI+的極限了(剩下的就是機器效能的提升了),如果再要提升,可以試試並行計算、C++ native、直接調用MMX/SSE指令、CUDA之類的技術。
我不知道現在技術發展下還有多少用到Bitmap的場合,只是覺得:追求開發效率和效能平衡的時候,Bitmap也能成為一個不錯的選擇。(總比絞盡腦汁寫Win32 ASM來得輕鬆)
測試程式:點擊下載
後記
有朋友指出:
GDI+這種 LockBits是臨時性的把映像的資料讀到記憶體,是不適合於做專業的影像處理軟體的,專業做的話一個映像載入後在記憶體中的格式應該是固定的,這樣做演算法也就是直接存取這段記憶體的資料。GetPixel之類的函數的存在也不是為了專業的影像處理的,而是對類似於螢幕取色或DC取色這樣小批量資料時方便處理。
要玩速度,影像處理方面的演算法先是用普通語言寫出來,對演算法的核心盡心最佳化,如果速度還不行,考慮用彙編進一步最佳化,越簡單的演算法,用彙編最佳化的速度能提高的倍數越高,比如,最簡單的反色演算法,3000*4000*24的映像,一般的語言要100ms左右的處理時間,用彙編的話20ms夠了,不過複雜的演算法,一般彙編能提升的檔次不會有這麼明顯。
儘管本文的目的並非追求速度,僅僅是「測試」速度,我還是嘗試著最佳化了一下代碼,就用上述「反色」操作為例進行了測試。
測試案例選擇#7(4096x4096 @ 24bpp),用時299ms,如下:
隨後再次改進演算法,得到了52ms的速度提升(約17%)。
這個結果,儘管較一般操作方式快了不少,但和「一般的語言100ms左右」比起來,還是「右」得多了一點(笑)。和彙編的「20ms」(無實驗資料)比,差得更遠了。
最佳化代碼似乎比較有趣,我就繼續試著最佳化一下。通過調整調用結構,改進演算法,使用多線程並行計算,總算是進入50ms了。
仍舊基於Bitmap類的LockBits/UnlockBits。
語言:C#、C#指標
測試機:i3 380M @2.53GHz,2.92G DDR3-1333,Windows 7 32位
速度:約50ms
網友測試結果對比
以下是部分熱心網友給出的測試結果資料,加以對比,供諸君參考。
測試專案統一為對規格為4096x4096x24bpp的位元影像映像進行反色處理。
測試1:
ImageWizard(作者:laviewpbt)
實現:彙編+VB.NET
配置:i3 380M @2.53GHz,2.92G DDR3-1333,Windows 7 32位
用時:25ms
測試2:
臨時測試(作者:蘭征鵬)
實現:VC++.NET調用SSE指令
配置:i7 860@2.93GHz,12G PC1333記憶體,Windows7 64位
用時:12~19ms
測試3:
GebImage(作者:xiaotie)
實現:C#重寫全部映像庫、unsafe指標
配置:優於測試1
用時:33ms
測試4:
本文(作者:野比)
實現:GDI+、unsafe指標
配置:同測試1
用時:46ms
(完)
2012 野比 conmajia@gmail.com