大快網站:如何選擇正確的hadoop版本
大快網站:如何選擇正確的hadoop版本
Hadoop的環境安裝部署是所有剛開始學習hadoop必然要面對的一個問題,對於新手而言基本不會一次性部署成功,甚至可能要花費好幾天的時間才能完成hadoop執行環境部署。所以對於新手來說,hadoop版本的選擇還是比較重要的。Hadoop除了Apache這個版本,還有許多第三方的版本,版本雖多但能夠像大快DKH有效解決hadoop部署管理複雜的問題很少。
目前hadoop的發行版除了我們熟知的Apache的開源版本之外,還有Intel發行版、Cloudera發行版(CDH)、Hortonworks發行版(HDP)、MapR等。國產的發行版如大快搜索DKH、華為發行版等。無論是國外的第三方發行版,還是國產的發行版基本都是基於Apache hadoop衍生出來的。由於hadoop誕生於國外,所以規則都是由國外製定的,國產發行版hadoop當然不止大快搜索一家,但敢做hadoop底層開發的也只有大快搜索!也正是由於大快所具備的技術優勢,DKH與其他第三方發行版hadoop才有這非常明顯的不同。
綜上所述,hadoop版本的選擇是具備多樣性的,理論上你可以選擇Apache發行版,或者是國外的第三方發行版,當然也有國內的發行版可供選擇。但對於入門級的新手而言,那些需要進行復雜環境部署的版本似乎不太適合,我們應該將學習的重點放在hadoop應用開發,而不是把研究的重點放在基礎環境的安裝。解決基礎環境安裝複雜問題的是我們這些做大資料底層技術開發的責任和義務。
如果要給hadoop入門級新手做一個hadoop版本的推薦,可以使用DKH的發行版hadoop。DKH標準版有三個不同的子版本:用於開發除錯的單機版;支援三節點的學習版;支援五節點以上的標準伺服器版。DKH-分散式SQL版有兩個子版本:學習版和伺服器版。入門級新手可以選擇DKH標準版中的支援三節點的學習版。
DKH有效的集成了整個HADOOP生態系統的全部元件,並深度優化,重新編譯為一個完整的更高效能的大資料通用計算平臺,實現了各部件的有機協調。如果說的再簡單點就是基礎執行環境的部署變得異常簡單,一鍵安裝,隨時呼叫!重點是,標準三節點的學習版是免費提供提下載的!
DKH標準版 DKH-分散式SQL版 DK.HADOOP發行版
DKH標準版有三個不同的子版本:用於開發除錯的單機版;支援三節點的學習版;支援5節點以上的標準伺服器版
DKH-分散式SQL版有兩個子版本:學習版、伺服器版