1. 程式人生 > >Hadoop 整體介紹

Hadoop 整體介紹

1 分散式檔案系統 HDFS

  • HDFS 是 GFS 的克隆版;
  • HDFS特點 : 擴充套件性,容錯性,海量資料儲存;
  • 將檔案切分為指定大小的資料塊並以多副本的儲存在多個機器;
  • 資料切分、多副本、容錯等操作對使用者是透明的;

2 分散式資源排程系統 YARN

  • Yet Another Resource Negotiator
  • 負責整個叢集資源的管理和排程
  • YARN 特點: 擴充套件性,容錯性,多框架資源統一排程

3 分散式計算框架 Mapreduce

  • 特點: 擴充套件性,容錯性,海量資料離線處理

4 Hadoop 優勢

4.1 可靠性

  • 資料儲存:資料塊多副本
  • 資料計算:重新排程作業計算

4.2 高擴充套件性

  • 儲存、計算資源不足時,可以橫向的線性擴充套件機器
  • 一個叢集可以包含很多節點

4.3 儲存在廉價機器,降低成本

4.4 成熟的生態圈