哈希函數 (Hash Functions)

Published: Mon Feb 16 2026 | Modified: Tue Mar 03 2026 , 2 minutes reading.

哈希函數：身份竊取者

演算法背後的故事：火漆封印的邏輯

在古代，國王使用火漆封印來證明信件沒有被拆開或篡改。如果封印被破壞或樣式不對，資訊就不可信了。

1953 年，IBM 的研究員 Hans Peter Luhn 正在尋找一種搜尋化學公式的方法。他意識到，如果他能將複雜的公式轉化為簡短的數字（哈希值），他就能在表中瞬間找到她們。

現代哈希函數就像是火漆封印的高科技版本。它讀取一本書、一張照片或一個密碼，並將其「消化」成一串簡短的字元。即便照片中只改變了一個像素，「封印」（哈希值）也會變得截然不同。

為什麼需要它？

哈希函數是數位世界的「DNA」。

數據完整性： 妳如何確定剛下載的 2GB 檔案沒有損壞？妳會比對她的 MD5 或 SHA256 哈希值。
安全性： 資料庫絕不應該儲存明文密碼，而應儲存密碼的哈希值。即使駭客入侵了資料庫，她們看到的也只是指紋，而不是鑰匙。
效率： 在比對兩個 100MB 的檔案之前，先比對她們 32 位元的哈希值。如果哈希值不同，檔案肯定不同。

演算法是如何「思考」的

這個演算法像是一個數學攪拌機。

吸入： 接收任何長度的輸入。
攪拌 (混合)： 對數據進行一系列數學「輪次」的處理——位移、異或 (XOR) 和取模運算。它將位元混合得如此徹底，以至於輸入的微小變化都會在輸出中產生「雪崩效應」。
壓縮： 吐出一個固定長度的、可預測的結果（例如 SHA-256 總是返回 256 位元）。

工程決策：碰撞戰爭

由於可能的輸入是無限的，而哈希值是有限的（例如 $2^{256}$ ），不同的輸入有可能產生相同的哈希值。這被稱為碰撞 (Collision)。

非加密型 (MurmurHash, CityHash)： 速度極快，但「可預測」。常用於 HashMap 和負載平衡器。
加密型 (SHA-2, SHA-3)： 速度較慢，但「抗碰撞」。用於密碼儲存和數位簽名，安全性優先。

實作參考 (Python)

import hashlib

def calculate_fingerprint(data):
    # 使用 SHA-256 確保高安全性與完整性
    hasher = hashlib.sha256()
    
    # 必須將字串編碼為位元流
    hasher.update(data.encode('utf-8'))
    
    # 返回十六進位摘要 (即易讀的指紋)
    return hasher.hexdigest()

# 範例
msg1 = "Hello World"
msg2 = "Hello world" # 僅改變了一個字母的大小寫

print(f"指紋 1: {calculate_fingerprint(msg1)}")
print(f"指紋 2: {calculate_fingerprint(msg2)}")
# 妳會發現兩個哈希值完全不同 (雪崩效應)

小結

哈希函數教會我們：身份是可以被壓縮的。透過將複雜性轉化為簡單的指紋，我們獲得了驗證、保護和索引整個世界的能力。它提醒我們，在無限資訊的宇宙中，一個微小而可靠的簽名是維持秩序的唯一錨點。

Luke Sun