1. 程式人生 > >加密演算法極先鋒之MD5演算法

加密演算法極先鋒之MD5演算法

在開發過程中,避免不了要涉及到資料加密,比如使用者賬號密碼的加密,使用者敏感資料的加密,涉及到的加密演算法種類繁多,作為拿來主義的開發者時間精力有限,能夠清楚其中主流的加密演算法和用途,就已經足夠了。

主要的資料加密演算法主要有:md5、sha、aes、des、rsa、base64等等。

先來看看我們的老熟人:md5演算法,幾乎在任何一個系統中,都少不了他的身影。MD5演算法全稱叫 Message Digest Algorithm 5(資訊摘要演算法5),是數字摘要演算法的一種實現,摘要長度為128位。由於其演算法的複雜性和不可逆性,主要用於確保資訊傳輸完整性和一致性。他還有早期的“不太爭氣”的幾代MD2、MD3、MD4(早期的幾代就是由於複雜度不夠被破解了)。正是由於MD5演算法有如此特性,在業界應用非常廣泛,主流的程式語言都自帶有MD5的實現。


最常見的,很多系統中的使用者密碼都採用了MD5加密演算法進行加密。但是樹大必然招風,就像windows系統應用廣泛了,安全性就收到了挑戰,MD5也不例外。度娘一下就會發現,有諸多網站提供MD5破解,有的甚至需要收費提供破解服務。

不過不用擔心,目前能破解MD5並還原出原始資料的成功率很低(當然像123456這種弱智的原文,就不要提了,其他的破解可以自行度娘試試)。這就需要提到現行MD5演算法的主要破解思路,其實核心只有一個,那就是暴力碰撞(其他還有兩種 字典法、彩虹表法都是暴力碰撞法的改良,原理一樣),說白了就是用已知的字元進行各種變態組合,生成眾多的密文與原文的對應庫,然後反向根據密文,找到對應的明文。

比如,你的明文資料是 abcd1234(當然實際不應該這麼簡單,這裡只是舉例),加密出來的密文是e19d5cd5af0378da05f63f891c7467af,那麼不安好心的人就會用密文e19d5cd5af0378da05f63f891c7467af去提供這種破解的工具或者服務那裡,查詢這個密文有沒有對應明文,如果有,就代表破解成功了,然後他就拿這個“破解”得到的明文去登入你的賬號,結果可想而知。

成功進入了你的領地,但這個成功,是不完美的。因為md5的不可逆性,大多數賬號登入過程,只能拿使用者輸入的原文加密成MD5密文後去跟資料庫裡的密文比較,相同則認定密碼正確。

但這也有漏網之魚,因為即使破解出來的結果不是上面說到的abcd1234而是xxxxx,也有可能用xxxx成功登入系統。

因為MD5雖然不可逆,但不是唯一性。 這裡所謂的破解,並非把摘要還原成原文。為什麼呢?因為固定128位的摘要(也就是加密後的密文)是有窮的,而原文數量是無窮的,每一個摘要都可以由若干個原文通過Hash得到。換句人話說,就是不同的原文可能加密後得到相同的密文。那麼拿密文猜測原文就會得到多個結果,單純比較密文,就會被認為是一致的。而反過來,也是同理。拿到不一定對的還原出來的明文去做其他操作,也不一定能成功。

總結一下,MD5加密演算法之所以破解成功的概率很低,主要由於以下幾點:
1)依賴暴力碰撞的破解思路,意味著需要儘可能多的組合所有字元,形成海量的配對庫,用於通過密文反向查詢明文,但字元種類千千萬萬,所有都進行組合,可能性都超過地球的細胞總數了,估計現在所有硬碟加在一起的空間都存不下,成本之高,可想而知。

2)目前能破解的都屬於已經被組合猜測過的,一般也都是長度較短的或者比較有規律的組合。只要長度越長越沒有規律,不同型別字元組合越多,破解概率越低,幾乎不會成功。

3)就算密文對了,原始明文也不一定對,當然這是最後一道防線,聽天由命了。

另外,MD5的用途,目前主流的無非兩種,一種是用於類似使用者密碼等不需要還原的敏感資料的加密,一種是用於確保資訊傳輸完整性和一致性。其實,第二種用途才是他誕生的初衷。

這裡簡單提一下第二種用途。很多支付介面、資料互動介面,都採用基於MD5來確保資料的完整性和一致性,也就是在網路傳輸過程中沒有被篡改。如何保證資料不被篡改,僅僅依靠MD5做不到,還需要聯手其他加密演算法,具體請後續再談。

本文由弈碼當先 root1024 獨家釋出!