1. 程式人生 > 其它 >python模組之hashlib模組

python模組之hashlib模組

hashlib模組

加密:將明文資料通過一系列演算法變成密文資料。

   #  其目的就是為了讓資料更加的安全

加密演算法:md系列 sha系列 base系列 hmac系列

基本使用

import hashlib

1.先確定演算法型別  # (md5普遍使用)
md5 = hashlib.md5()
2.將明文資料傳遞給md5演算法  # (update只能接受bytes型別資料)
md5.update('xxx'.encode('utf8'))
3.獲取加密之後的密文資料   # 其是一串沒有規則的隨機字串
res = md5.hexdigest()
print(res)

"""
1.加密之後的密文資料是沒有辦法反解密成明文資料的
    市面上所謂的破解 其實就是提前算出一系列明文對應的密文
    之後比對密文再獲取明文
"""

詳細操作

1.明文資料只要是相同的 那麼無論如何傳遞加密結果肯定是一樣的


import hashlib
# 1.先確定演算法型別(md5普遍使用)
md5 = hashlib.md5()
# 2.將明文資料傳遞給md5演算法(update只能接受bytes型別資料)
md5.update('xxx'.encode('utf8'))
# 3.獲取加密之後的密文資料(沒有規則的一串隨機字串)
res = md5.hexdigest()
print(res)  # f561aaf6ef0bf14d4208bb46a4ccb3ad

2.密文資料越長表示內部對應的演算法越複雜 越難被正向破解

import hashlib
# 1.先確定演算法型別(md5普遍使用)
md5 = hashlib.sha256()  # 此處使用sha256()
# 2.將明文資料傳遞給md5演算法(update只能接受bytes型別資料)
md5.update(b'123')  # 可直接用b+字串轉為二進位制
# 3.獲取加密之後的密文資料(沒有規則的一串隨機字串)
res = md5.hexdigest()
print(res)  # 6ec0f865ec4e9bcf9abc7f6c0e7268acfb2ba36f3e460fd592a214f7eacc92b0
##########
密文越長表示演算法越複雜 對應的破解演算法的難度越高
但是越複雜的演算法所需要消耗的資源也就越多 密文越長基於網路傳送需要佔據的資料也就越大
    具體使用什麼演算法取決於專案的要求 一般情況下md5足夠了

3.實用場景:涉及到使用者密碼儲存 其實都是密文 只要使用者自己知道明文是什麼

    1.內部程式設計師無法得知明文資料
    2.資料洩露也無法得知明文資料
eg:ATM購物車練習 使用者密碼採取的就是密文存取

4.加鹽處理

#  在對明文資料做加密處理過程前新增一些干擾項
password = input('密碼>>>')
# # 1.先確定演算法型別(md5普遍使用)
md5 = hashlib.md5()
# # 2.將明文資料傳遞給md5演算法(update只能接受bytes型別資料)
# # 加鹽(干擾項)
md5.update('加鹽了'.encode('utf8'))
# 真實資料
md5.update(password.encode('utf8'))
# # 3.獲取加密之後的密文資料(沒有規則的一串隨機字串)
res = md5.hexdigest()
print(res)

5.動態加鹽

#  在對明文資料做加密處理過程前新增一些變化的干擾項 

但是每次執行干擾項是不同的 
故:這裡可以用到time.time()作為干擾項
這樣每次執行時間戳都不一樣 干擾項也就為動態的
password = input('密碼>>>')
# # 1.先確定演算法型別(md5普遍使用)
md5 = hashlib.md5()
# # 2.將明文資料傳遞給md5演算法(update只能接受bytes型別資料)
# # 加鹽(干擾項)
import time
res = str(time.time())  # 因只有字串才可以轉為二進位制 故這裡需要將時間戳改為字串型別
md5.update(res.encode('utf8'))
# 真實資料
md5.update(password.encode('utf8'))
# # 3.獲取加密之後的密文資料(沒有規則的一串隨機字串)
res = md5.hexdigest()
print(res)

6.校驗檔案一致性

檔案不是很大的情況下 可以將所有檔案內部全部加密處理
但是如果檔案特別大 全部加密處理相當的耗時好資源 如何解決???
    針對大檔案可以使用切片讀取的方式 
import hashlib
md5 = hashlib.md5()
with open(r'a.txt','rb') as f:
    for line in f:
        md5.update(line)
real_data = md5.hexdigest()
print(real_data)  # 29d8ea41c610ee5d1e76dd0a42c7e60a

with open(r'a.txt','rb') as f:
    for line in f:
        md5.update(line)
error_data = md5.hexdigest()
print(error_data)  # 738a56b49f24884ba758d1e4ab6ceb74
import os
# 讀取檔案總大小
res = os.path.getsize(r'a.txt')
# 指定分片讀取策略(讀幾段 每段幾個位元組)  10   f.seek()
read_method = [0,res//4,res//2,res]