1分鐘瞭解區塊鏈的本質
區塊鏈,比特幣這些概念最近都很火,但很多人搞不清楚它究竟是啥,準備從技術的角度,從架構的角度,用通俗的語言談談樓主的理解。
究竟啥是區塊鏈?
答:一句話,區塊鏈是一個儲存系統。
更細一點,區塊鏈是一個沒有管理員,每個節點都擁有全部資料的分散式儲存系統。
通常所見的儲存系統是啥樣的?
答:如上圖,一塊空間儲存資料,一個軟體管理資料,提供介面寫入資料,這是儲存系統,例如mysql。
普通的儲存系統會有什麼常見的問題?
答:常見的有兩個問題:
資料存在一個地方很危險,空間損壞資料就丟了,用技術的話說即“資料不高可用”
寫入點只有一個,用技術的話說即“單點控制”
如何保證資料高可用?
答:解決高可用要“冗餘”,如上圖,如果能把資料冗餘到多個地方,就能保證高可用,一個地方的資料掛了,另外的地方仍存有資料。例如
這裡需要強調兩點:
資料冗餘往往會引發一致性問題,例如mysql主從叢集中的讀寫延時問題
資料冗餘往往會降低寫入效率,因為同步資料需要消耗額外的資源
可不可以多點寫入?
答:可以。可以多個節點都實施寫入,例如mysql雙主叢集,又或者多機房多活資料中心。這裡要強調的是,多節點寫入往往會引發寫寫衝突的一致性問題。
多點控制寫入之後,其實出現了多中心控制,在資料不一致的時候,往往需要有一個演算法來協商如何處理不一致資料。
例如,存在兩個中心節點時,可以約定這樣的演算法來處理不一致:
以時間戳最小的資料為準,即先來先得
又例如,存在多箇中心節點時,可以約定這樣的演算法來處理不一致:
投票,以多數票的資料為準
什麼是區塊鏈?
答:
區塊是一塊儲存空間,可以儲存資料
區塊鏈不但像連結串列一樣把區塊串起來,還有約定了一系列的方法管理這些資料,所以它是儲存系統
區塊鏈有很多節點,每個節點都儲存了全部的資料,所以它是高可用的
每一箇中心節點都可以生成區塊,並寫入資料,所以每一個點都是中心節點,或者說區塊鏈是去中心化的,要想控制整個系統,必須控制一半以上的節點,才能控制投票,於是這個系統沒有管理員
綜上,區塊鏈實際上是一個沒有管理員的,去中心化的,每個節點都擁有全部資料的分散式儲存系統。只要你願意,你隨時可以成為區塊鏈中的一個節點,並參與區塊的生成與寫入,比特幣就是基於這個分散式儲存上的電子貨幣。
由於節點很多,很多資料需要同步,這個系統的儲存容量其實不大,目前全球儲存比特幣的區塊鏈也就100多G。
畫外音:額,有朋友說他們公司的mysql資料庫輕輕鬆鬆幾百G。
因為節點很多,資料需要保持一致,這個系統的寫入效率也很低,儲存比特幣的區塊鏈每10分鐘才生成1個區塊,1個區塊只有1M的儲存空間,只夠寫入2000筆比特幣交易的資料。
畫外音:比特幣全球交易,每10分鐘只能處理2000筆交易。有朋友說他們公司自研的儲存系統輕輕鬆鬆;每秒處理交易10W筆。
關於區塊鏈,本文只說了概念,作為一個儲存系統,資料的生成,寫入,管理,資料一致性,資料衝突處理方法,資料完整性保證…很多細節未來再用“通俗技術性文字”和大家分享。
希望這一分鐘,大家瞭解了區塊鏈的本質。