MD5是常用的密碼編譯演算法,也經常用於校正資訊完整,如檔案的完整性。用術語講,MD5是一種訊息摘要演算法(Message Digest Algorithm)。另外還有一種常用的訊息摘要演算法SHA1。如果想瞭解這些的話,可以去百度百科:MD5、SHA1、訊息摘要演算法。
Java已經實現了MD5、SHA1演算法。利用java.security.MessageDigest類就可以擷取字串和檔案的MD5以及SHA1結果。
1.字串的MD5(下面的代碼有詳細注釋)
public static String stringMD5(String input) { try { // 拿到一個MD5轉換器(如果想要SHA1參數換成”SHA1”) MessageDigest messageDigest =MessageDigest.getInstance("MD5"); // 輸入的字串轉換成位元組數組 byte[] inputByteArray = input.getBytes(); // inputByteArray是輸入字串轉換得到的位元組數組 messageDigest.update(inputByteArray); // 轉換並返回結果,也是位元組數組,包含16個元素 byte[] resultByteArray = messageDigest.digest(); // 字元數群組轉換成字串返回 return byteArrayToHex(resultByteArray); } catch (NoSuchAlgorithmException e) { return null; } }
//下面這個函數用於將位元組數組換成成16進位的字串
public static String byteArrayToHex(byte[] byteArray) { // 首先初始化一個字元數組,用來存放每個16進位字元 char[] hexDigits = {'0','1','2','3','4','5','6','7','8','9', 'A','B','C','D','E','F' }; // new一個字元數組,這個就是用來組成結果字串的(解釋一下:一個byte是八位二進位,也就是2位十六進位字元(2的8次方等於16的2次方)) char[] resultCharArray =new char[byteArray.length * 2]; // 遍曆位元組數組,通過位元運算(位元運算效率高),轉換成字元放到字元數組中去 int index = 0; for (byte b : byteArray) { resultCharArray[index++] = hexDigits[b>>> 4 & 0xf]; resultCharArray[index++] = hexDigits[b& 0xf]; } // 字元數組組合成字串返回 return new String(resultCharArray);}
從上面代碼可以看出,使用MessageDigest對字串進行MD5演算法的步驟是,先將字串轉換成位元組數組,在進行MD5演算法,最後返回的也是一個位元組數組,要我們自己轉成32位的字串。
2.檔案MD5
對檔案進行MD5也可以像字串MD5一樣的,首先要把檔案轉成位元組數組,後面和字串MD5完全一樣。
但是如果是一個特別大的檔案,一下子把一個檔案的數組全部讀到記憶體中,那麼估計記憶體也吃不消。
對於大檔案,可以使用DigestInputStream。
public static String fileMD5(String inputFile) throws IOException { // 緩衝區大小(這個可以抽出一個參數) int bufferSize = 256 * 1024; FileInputStream fileInputStream = null; DigestInputStream digestInputStream = null; try { // 拿到一個MD5轉換器(同樣,這裡可以換成SHA1) MessageDigest messageDigest =MessageDigest.getInstance("MD5"); // 使用DigestInputStream fileInputStream = new FileInputStream(inputFile); digestInputStream = new DigestInputStream(fileInputStream,messageDigest); // read的過程中進行MD5處理,直到讀完檔案 byte[] buffer =new byte[bufferSize]; while (digestInputStream.read(buffer) > 0); // 擷取最終的MessageDigest messageDigest= digestInputStream.getMessageDigest(); // 拿到結果,也是位元組數組,包含16個元素 byte[] resultByteArray = messageDigest.digest(); // 同樣,把位元組數群組轉換成字串 return byteArrayToHex(resultByteArray); } catch (NoSuchAlgorithmException e) { return null; } finally { try { digestInputStream.close(); } catch (Exception e) { } try { fileInputStream.close(); } catch (Exception e) { } } }
上面的方法本人親測過大小約4G的檔案,得出的MD5值和網上下載的一個MD5小工具得到的MD5值一樣,說明上面的方式沒有什麼問題。不過取大檔案的MD5很慢,4G的檔案跑一下要一分鐘(I5處理器 6G記憶體 64位XP系統 本本)。
附1:我在網上還看到一種給檔案MD5的方式
public static String getFileMD5String(File file) throws IOException{ FileInputStream in = new FileInputStream(file); FileChannel ch =in.getChannel(); MappedByteBuffer byteBuffer =ch.map(FileChannel.MapMode.READ_ONLY, 0,file.length()); messagedigest.update(byteBuffer); return byteArrayToHex (messagedigest.digest());}
我也嘗試過這樣的方式,但是如果檔案大於2G,那麼這種方式會出現異常。所以不推薦。
附2:測試檔案MD5的main方法
public static void main(String[] args) { long startTime = System.currentTimeMillis(); try { System.out.println(fileMD5("E:/軟體/VS2008ProEdition90DayTrialCHSX1435983.iso")); } catch (IOException e) { e.printStackTrace(); } long endTime = System.currentTimeMillis(); System.out.println((endTime - startTime)/1000);}
作者:叉叉哥 轉載請註明出處:http://blog.csdn.net/xiao__gui/article/details/8148203