python3標準庫hashlib模組__摘要演算法防篡改

阿新 • • 發佈：2018-11-09

1.hashlib基礎知識點

（1）hashlib提供了常用的摘要演算法：SHA1, SHA224, SHA256, SHA384, SHA512, MD5。

（2）摘要演算法：摘要演算法又稱為雜湊演算法、雜湊演算法。他通過一個函式，把任意長度的資料轉換成一個固定長度的資料串，通常來說是16進位制的字串來進行表示。

（3）摘要演算法的目的：通過f()將任意長度data轉換成固定長度digest，為了發現原始資料是否被人篡改過。

（4）摘要演算法並不是加密演算法，不能用於加密（因為無法通過摘要反推明文），只能用於防篡改。

（5）摘要演算法的單向計算特性決定了可以在不儲存明文口令的情況下驗證使用者口令。

（6）兩個不同的資料通過同一個摘要演算法完全有可能得到相同的digest, 因為任何摘要演算法都是把無限多的資料集合對映到一個有限的集合中。

2.MD5演算法

（1）MD5演算法是最常用的摘要演算法，速度快，生成的是固定的128bit位元組，通常用32位的16進位制字串表示。

（2）待摘要的資料量非常大，可多次update。

（3）常用方法：hashlib.md5(), hashlib.md5().update(string), hashlib.md5().digest()

import hashlib


m = hashlib.md5()                             # 建立md5物件

m.update(b"hello")
print(len(m.hexdigest()), m.hexdigest())      # 32 5d41402abc4b2a76b9719d911017c592

m.update("你好".encode(encoding="utf-8"))
print(len(m.digest()), m.digest())            # 16 b',\xfe6\x11f\x07\x8cYs\x0c\x07\\\x96k\xfe\x91'

# ------------------------------------------------------------------------------------------------------- #
# update(string): Update this hash object's state(雜湊物件的狀態) with the provided string.
# digest(): Return the digest value as a string of binary data(二進位制資料字串).
# hexdigest(): Return the digest value as a string of hexadecimal digits(十六進位制資料字串).
# ------------------------------------------------------------------------------------------------------- #

3.SHA系列演算法

（1）SHA1的結果是160 bit位元組，通常用一個40位的16進位制字串表示。

（2）SHA256和SHA512相比於SHA1更加的安全，不過越安全的演算法越慢，而且摘要長度更長。

import hashlib


# SHA1
s1 = hashlib.sha1()
s1.update(b"hello")
print(len(s1.digest()), s1.digest())             # 20 b'\xaa\xf4\xc6\x1d\xdc\xc5\xe8\xa2\xda\xbe\xde\x0f;H,\xd9\xae\xa9CM'
print(len(s1.hexdigest()), s1.hexdigest())       # 40 aaf4c61ddcc5e8a2dabede0f3b482cd9aea9434d

s1.update("你好".encode(encoding="utf-8"))
print(len(s1.digest()), s1.digest())             # 20 b'AO>\xb5\xcfS[\xaa)N\xe4$.\xcf\xe4`\x1b!Rl'
print(len(s1.hexdigest()), s1.hexdigest())       # 40 414f3eb5cf535baa294ee4242ecfe4601b21526c

# SHA256:比較常用的
s256 = hashlib.sha256()
s256.update(b"hello")
print(len(s256.digest()), s256.digest())         # 32 b',\xf2M\xba_\xb0\xa3\x0e&\xe8;*\xc5\xb9\xe2\x9e\x1b\x16\x1e\\\x1f\xa7B^s\x043b\x93\x8b\x98$'
print(len(s256.hexdigest()), s256.hexdigest())   # 64 2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824

4.摘要演算法應用

任何允許使用者登入的網站都會儲存使用者登入的使用者名稱和口令，一般採用的方法是將使用者名稱和對應的口令儲存到資料庫的一張二維表中：

name passwd

tom 123456

marry abc123

admin admin_maxin

如果以明文儲存使用者口令，如果資料庫洩露，所有使用者的口令就落入駭客的手裡。此外，網站運維人員是可以訪問資料庫的，也就是能獲取到所有使用者的口令。所以，正確的儲存口令的方式是儲存口令的摘要：

name passwd

tom e10adc3949ba59abbe56e057f20f883e

marry e99a18c428cb38d5f260853678922e03

admin 20973b101799904f6e234f0c17969610

當用戶登入時，首先計算使用者輸入的明文口令的MD5，然後和資料庫儲存的MD5對比，如果一致，說明口令輸入正確，如果不一致，口令肯定錯誤。

考慮這麼個情況，很多使用者喜歡用123456，888888，password這些簡單的口令，於是，駭客可以事先計算出這些常用口令的MD5值，得到一個反推表。因此，駭客只需要對比資料庫的MD5，就獲得了使用常用口令的使用者賬號。

由於常用口令的MD5值很容易被計算出來，所以，要確保儲存的使用者口令不是那些已經被計算出來的常用口令的MD5，這一方法通過對原始口令加一個複雜字串來實現，俗稱“加鹽”。
def calc_md5(password):
    return get_md5(passwd + "the-Salt")
經過Salt處理的MD5口令，只要Salt不被黑客知道，即使使用者輸入簡單口令，也很難通過MD5反推明文口令。但是如果有兩個使用者都使用了相同的簡單口令比如123456，在資料庫中，將儲存兩條相同的MD5值，這說明這兩個使用者的口令是一樣的。

為了讓使用相同口令的人在資料庫二維表中儲存不同的MD5，則可通過：
def register(username, passwd):
    db[username] = get_md5(passwd + username + "the-Salt")

name	passwd
tom	123456
marry	abc123
admin	admin_maxin

name	passwd
tom	e10adc3949ba59abbe56e057f20f883e
marry	e99a18c428cb38d5f260853678922e03
admin	20973b101799904f6e234f0c17969610

# ! /usr/bin/env python
# coding:utf-8
# python interpreter:3.6.2
# author: admin_maxin
import hashlib
import datetime
import shelve
import time


# 設定登入超時時間
LOGIN_TIME_OUT = 0.60

# 設定臨時儲存使用者“name”和“password”的shelve檔案;允許寫回
db = shelve.open("user_shelve", writeback=True)


# 新使用者註冊
def register():
    name = None

    # 對使用者名稱的合法性進行檢驗
    while True:
        name = input("register name:").strip()
        if name in db:
            print("Name already exits!Please try again!")
            continue
        elif None == name:
            print("The name cannot be empty!")
            continue
        elif "Q" == name:
            return
        else:
            break

    pwd = input("register passwd:").strip()
    # 防止相同pwd的人儲存相同的md5
    db[name] = {"passwd": md5_digest(pwd + name), "last_login_time": time.time()}


# 判斷當前使用者“是否合法”和“是否超時”
def olduser():
    name = None
    pwd = None
    passwd = None

    while True:
        name = input("name:").strip()
        passwd = input("passwd:").strip()

        # 判斷當前使用者“是否註冊”
        try:
            pwd = db[name]["passwd"]
            break
        except AttributeError as ae:
            print("\003[1;31;40mUsername '%s' doesn't existed\033[0m" % name)
            break
        except IndexError as ie:
            print("\003[1;31;40mUsername '%s' doesn't existed\033[0m" % name)
            break

    # 判斷密碼摘要是否準確
    if md5_digest(passwd + name) == pwd:
        login_time = time.time()
        last_login_time = db[name]["last_login_time"]

        # 判斷當前使用者是否超過了登入時間
        if login_time - last_login_time < LOGIN_TIME_OUT:
            print("\033[1;31;40mYou already logged in at: <%s>\033[0m" % datetime.datetime.fromtimestamp(last_login_time).isoformat())

        # 更新最近登入時間
        db[name]["last_login_time"] = login_time
        print("\033[1;32;40mwelcome back\033[0m", name)
    else:
        print("\033[1;31;40mlogin incorrect\033[0m")


# md5摘要傳輸近來的明文
def md5_digest(message):
    m5 = hashlib.md5()
    m5.update(message.encode(encoding="utf-8"))
    return m5.hexdigest()


# 主介面
def menu():
    prompt = """
    (N)ew User Login
    (E)xisting User Login
    (Q)uit
    Enter choice: """

    # 設定程式退出標誌
    flg = False
    while not flg:
        choice = None
        while True:
            try:
                choice = input(prompt).strip()[0].lower()
            # 捕獲異常選擇直接變成選q退出程式
            except (EOFError, KeyboardInterrupt):
                print("\033[1;31;40m Error！\033[0m")
                return

            print("\nYou picked: [%s]" % choice)  # 提示你的選擇是什麼
            if choice not in "neq":
                print("invalid option, try again")
                continue
            else:
                break

        if choice == "q":
            flg = True
        if choice == "n":
            register()
        if choice == "e":
            olduser()

    # 操作完成之後關閉檔案控制代碼
    db.close()


# 測試模組
if "__main__" == __name__:
    menu()

5.彩虹表破解

彩虹表（rainbow table）是一個用於加密雜湊函式逆運算的預先計算好的表, 為破解密碼的雜湊值（或稱雜湊值、微縮圖、摘要、指紋、雜湊密文）而準備。一般主流的彩虹表都在100G以上；這樣的表常常用於恢復由有限集字元組成的固定長度的純文字密碼；這是空間 / 時間替換的典型實踐, 比每一次嘗試都計算雜湊的暴力破解處理時間少而儲存空間多，但卻比簡單的對每條輸入雜湊翻查表的破解方式儲存空間少而處理時間多；使用加salt的KDF函式可以使這種攻擊難以實現。

6.hmac模組

python 還有一個 hmac 模組，它內部對我們建立 key 和內容再進行處理然後再加密。雜湊訊息鑑別碼，簡稱HMAC，是一種基於訊息鑑別碼MAC（Message Authentication Code）的鑑別機制。使用HMAC時,訊息通訊的雙方，通過驗證訊息中加入的鑑別金鑰K來鑑別訊息的真偽；一般用於網路通訊中訊息加密，前提是雙方先要約定好key,就像接頭暗號一樣，傳送方：key將訊息加密，接收方：key ＋訊息明文再加密。拿加密後的值跟傳送者的相對比是否相等，這樣就能驗證訊息的真實性，及傳送者的合法性了。

使用hmac演算法比標準的hash演算法更加的安全，因為針對相同的message，不同的key會產生不同的hash.

import hmac


key1 = "天王蓋地虎"
msg = "你是250"
msg2 = "都是250"
send = hmac.new(key1.encode(encoding="utf-8"), msg.encode(encoding="utf-8"), digestmod="md5")
print(len(send.digest()), send.digest())           # 16 b'\x01\xa0m\r5EL\x9fp\\\xfe\xc6S\xb8Co'
print(len(send.hexdigest()), send.hexdigest())     # 32 01a06d0d35454c9f705cfec653b8436f

receive = hmac.new(key1.encode(encoding="utf-8"), msg2.encode(encoding="utf-8"), digestmod="md5")
print(receive == send)                             # False: 原始資訊發生變化
# ------------------------------------------------------------------------------------------------------- #
# hmac.new():Create a new hashing object and return it
#   key: The starting key for the hash.
#   msg: if available, will immediately be hashed into the object's starting state.
# ------------------------------------------------------------------------------------------------------- #

python3標準庫hashlib模組__摘要演算法防篡改

1.hashlib基礎知識點（1）hashlib提供了常用的摘要演算法：SHA1, SHA224, SHA256, SHA384, SHA512, MD5。（2）摘要演算法：摘要演算法又稱為雜湊演算法、雜湊演算法。他通過一個函式，把任意長度的資料轉換成一個固定長度的資料串，

python3標準庫sys模組

1.sys模組原始碼 # encoding: utf-8 # module sys # from (built-in) # by generator 1.145 """ This module provides access to some objects used or maint

python3標準庫random模組

1.random模組原始碼 """Random variable generators. 隨機變數生成器 integers -------- uniform within range sequences ---------

python3標準庫序列化json / packle / shelve 模組

1、序列化 1. 定義：把變數從記憶體中變成可儲存或可傳輸的過程稱之為序列化。在Python中叫pickling，在其他語言中也被稱之為serialization，marshalling，flattening等等，都是一個意思。 2. 序列化之後，就可以把序列化後的內容寫

python3標準庫time / datetime模組

1.有關時間的基本知識點（1）表示時間的方式 a）時間戳：timestamp b）格式化的時間字串：Format string c）共9個元素的元組：struct_time （2）時間表示方式的說明 a）UTC（Coordinated Univ

hashlib模組（摘要演算法，用於加密）

目錄演算法介紹加鹽演算法介紹 Python的hashlib提供了常見的摘要演算法，如MD5，SHA1，SHA224, SHA256, SHA384, SHA512等演算法。什麼是摘要演算法呢？摘要演算法又稱雜湊演算法、雜湊演算法。它通過一個函式，把任意長度的資料轉換為

[譯]C++17,標準庫新引入的並行演算法

看到一個介紹 C++17 的系列博文(原文),有十來篇的樣子,覺得挺好,看看有時間能不能都簡單翻譯一下,這是第七篇~ C++17 對 STL 演算法的改動,概念上其實很簡單.標準庫之前有超過100個演算法,內容包括搜尋,計數,區間及元素操作等等.新標準過載了其中69個演算法

python標準庫常用模組（一）-----------------------------time模組詳解及相關演示程式碼

要想了解time模組，我們需要首先了解一下時間的三種表現形式： 1.時間戳：當前距離1970年的秒數 2.格式化的字串：即2018年9月11日的這種表現形式 3.struct_time:元組時間，以元組的形式顯示時間，一共有九個元素下面來介紹一下它具體的方法及示例程

python標準庫常用模組（三）-----------------------------OS模組詳解，呼叫系統的命令

OS模組是呼叫系統命令的模組，和執行cmd的命令相似。 1.獲取當前的工作目錄：getcwd() 2.改變當前指令碼的工作目錄：chdir(path) 3.返回當前目錄：curdir() 4.獲取當前目錄的父目錄：pardir() 5.若目錄為空，則刪除，遞迴到上一

[Python模組學習]使用標準庫fractions模組使Python支援分數型別

fractions模組 fractions模組提供了分數型別的支援。 Fraction類該類是fractions模組的核心，它繼承了numbers.Rational類並且實現了該類所有的方法。建構函式並不複雜： class fraction

Python標準庫(各種模組介紹)

"We'd like to pretend that 'Fredrik' is a role, but even hundreds of volunteers couldn't possibly keep up. No, 'Fredrik' is the result of crossing an http

為skynet的crypt庫擴充套件一些加密(摘要)演算法支援

改造起因在上篇文章, 我描述了為skynet新增穩定的websocket支援的起始並闡述了這麼做的原因. 這幾天在測試的時候發現

C++拾取——使用stl標準庫實現排序演算法及評測

今天看了一篇文章，講各種語言的優勢和劣勢。其中一個觀點：haskell非常適合寫演算法，因為使用者不用去關心具體的計算機實現，而只要關注於操作語義。這讓它在專心研究演算法的人中非常受歡迎。所以很多時候，語言的爭論沒有太多的意義，有意義的是它

python_day12_模組、標準庫、常用模組

模組一旦被呼叫，即相當於執行了另外檔案裡的程式碼模組分為三種：內建標準庫 sys、os help(“modules”) 第三方模組、通過pip install name 自定義模組 http://pypi.python.org 引用國內豆瓣源 pip

Python標準庫(非常經典的各種模組介紹)

https://blog.csdn.net/liujinwei2005/article/details/76725422 0.1. 關於本書 0.2. 程式碼約定 0.3. 關於例子 0.4. 如何聯絡我們核心模組 1.1. 介紹

python基礎——第10章模組和標準庫

目錄 10.1.1 10.1.3 讓模組可用 10.1.4 包表10-1 一種簡單的包佈局 10.1.1 要告訴直

python標準庫模組

06/07 20:10:08 編譯 def function(a, b): print a, b apply(function, (“whither”, “canada?”)) apply(function, (1, 2 + 3)) whither canad

重學C++ 標準庫演算法

求最大值 vector<int> vv { 11,223, 22 }; auto itor = std::max_element(vv.begin(), vv.end()); if (itor != vv.end()) {

Python標準庫筆記(11) — Operator模組

Operator——標準功能性操作符介面. 程式碼中使用迭代器時,有時必須要為一個簡單表示式建立函式。有些情況這些函式可以用一個lambda函式實現，但是對於某些操作，根本沒必要去寫一個新的函式。因此operator模組定義了一些函式，這些函式對應於算術、比較和其他與標準物件API對應的操作。

python3標準庫之反解析模組——dis module

一、位元組碼 1、位元組碼是什麼。 python的原始檔是以.py結尾的，不知你是否見過或者聽說過以.pyc結尾的檔案，它儲存在__pycache__的資料夾中，這就是位元組碼。 2、位元組碼存在的作用。 python是解釋性語言，它在執行時將原始碼編譯成一組虛擬機器

python3__標準庫__hashlib模組__摘要演算法防篡改

1.hashlib基礎知識點

2.MD5演算法

3.SHA系列演算法

4.摘要演算法應用

5.彩虹表破解

6.hmac模組

相關推薦

python3標準庫hashlib模組__摘要演算法防篡改