【轉載】Hadoop產品介紹

阿新 • • 發佈：2018-12-05

http://blog.fens.me/hadoop-family-roadmap/

Apache Hadoop: 是Apache開源組織的一個分散式計算開源框架，提供了一個分散式檔案系統子專案(HDFS)和支援MapReduce分散式計算的軟體架構。
Apache Hive: 是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張資料庫表，通過類SQL語句快速實現簡單的MapReduce統計，不必開發專門的MapReduce應用，十分適合資料倉庫的統計分析。
Apache Pig: 是一個基於Hadoop的大規模資料分析工具，它提供的SQL-LIKE語言叫Pig Latin，該語言的編譯器會把類SQL的資料分析請求轉換為一系列經過優化處理的MapReduce運算。

Apache HBase: 是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化儲存叢集。
Apache Sqoop: 是一個用來將Hadoop和關係型資料庫中的資料相互轉移的工具，可以將一個關係型資料庫（MySQL ,Oracle ,Postgres等）中的資料導進到Hadoop的HDFS中，也可以將HDFS的資料導進到關係型資料庫中。
Apache Zookeeper: 是一個為分散式應用所設計的分佈的、開源的協調服務，它主要是用來解決分散式應用中經常遇到的一些資料管理問題，簡化分散式應用協調及其管理的難度，提供高效能的分散式服務

Apache Mahout:是基於Hadoop的機器學習和資料探勘的一個分散式框架。Mahout用MapReduce實現了部分資料探勘演算法，解決了並行挖掘的問題。
Apache Cassandra:是一套開源分散式NoSQL資料庫系統。它最初由Facebook開發，用於儲存簡單格式資料，集Google BigTable的資料模型與Amazon Dynamo的完全分散式的架構於一身
Apache Avro: 是一個數據序列化系統，設計用於支援資料密集型，大批量資料交換的應用。Avro是新的資料序列化格式與傳輸工具，將逐步取代Hadoop原有的IPC機制

Apache Ambari: 是一種基於Web的工具，支援Hadoop叢集的供應、管理和監控。
Apache Chukwa: 是一個開源的用於監控大型分散式系統的資料收集系統，它可以將各種各樣型別的資料收整合適合 Hadoop 處理的檔案儲存在 HDFS 中供 Hadoop 進行各種 MapReduce 操作。
Apache Hama: 是一個基於HDFS的BSP（Bulk Synchronous Parallel)平行計算框架, Hama可用於包括圖、矩陣和網路演算法在內的大規模、大資料計算。
Apache Flume: 是一個分佈的、可靠的、高可用的海量日誌聚合的系統，可用於日誌資料收集，日誌資料處理，日誌資料傳輸。
Apache Giraph: 是一個可伸縮的分散式迭代圖處理系統，基於Hadoop平臺，靈感來自 BSP (bulk synchronous parallel) 和 Google 的 Pregel。
Apache Oozie: 是一個工作流引擎伺服器, 用於管理和協調執行在Hadoop平臺上（HDFS、Pig和MapReduce）的任務。
Apache Crunch: 是基於Google的FlumeJava庫編寫的Java庫，用於建立MapReduce程式。與Hive，Pig類似，Crunch提供了用於實現如連線資料、執行聚合和排序記錄等常見任務的模式庫
Apache Whirr: 是一套運行於雲服務的類庫（包括Hadoop），可提供高度的互補性。Whirr學支援Amazon EC2和Rackspace的服務。
Apache Bigtop: 是一個對Hadoop及其周邊生態進行打包，分發和測試的工具。
Apache HCatalog: 是基於Hadoop的資料表和儲存管理，實現中央的元資料和模式管理，跨越Hadoop和RDBMS，利用Pig和Hive提供關係檢視。
Cloudera Hue: 是一個基於WEB的監控和管理系統，實現對HDFS，MapReduce/YARN, HBase, Hive, Pig的web化操作和管理。

【轉載】Hadoop產品介紹

http://blog.fens.me/hadoop-family-roadmap/ Apache Hadoop: 是Apache開源組織的一個分散式計算開源框架，提供了一個分散式檔案系統子專案(HDFS)和支援MapReduce分散式計算的軟體架構。 Apac

【轉載】Hadoop 2.7.3 和Hbase 1.2.4安裝教程

啟動運行 property new rop net 文本文 .tar.gz cor 轉載地址：http://blog.csdn.net/napoay/article/details/54136398 目錄(?)[+] 一、機器環境

【轉載】WEBRTC基本介紹

webrtc 數據流應用帶寬工作 ogl 回聲 real 明顯 “WebRTC，名稱源自網頁實時通信（Web Real-Time Communication）的縮寫，是一個支持網頁瀏覽器進行實時語音對話或視頻對話的技術，是谷歌2010年以6820萬美元收購

【轉載】HTML語法介紹

https://www.cnblogs.com/wj-1314/articles/9221044.html HTML語法介紹一基本標籤（塊級標籤和內聯標籤） 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 &

【轉載】CSS基本介紹

https://www.cnblogs.com/wj-1314/articles/8372503.html CSS基本介紹一，我們為什麼需要CSS？　　使用css的目的就是讓網頁具有美觀一致的頁面，另外一個最重要的原因是內容與格式分離在沒有CSS之前，我們想要修改

【轉載】大牛很通俗地介紹《信號與系統》

推廣 mil 原始的智能控制最好有時如果數學根據轉載地址：http://emuch.net/bbs/viewthread.php?tid=4009368&fpage=1 第一課什麽是卷積卷積有什麽用什麽是傅利葉變換什麽是拉普拉斯變換引子

Hadoop（四）HDFS集群詳解【轉載】

.com mapr 不能訪問 sets hba 是把原子 linux中 x文件原文地址：http://www.cnblogs.com/zhangyinhua/p/7657937.html 閱讀目錄(Content) 一、HDFS概述 1.1、HDFS概述 1.2、H

Hadoop（一）之初識大數據與Hadoop【轉載】

hba 無效理解組織鼠標掌握能夠 through 2.3 原文地址：http://www.cnblogs.com/zhangyinhua/p/7647334.html 閱讀目錄(Content) 一、引言（大數據時代） 1.1、從數據中得到信息 1.2、大數據

【轉載】企業服務總線Enterprise service bus介紹

文章 ring 就是技術分享責任定位 mas 業務 aps 企業服務總線(Enterprise service bus). 以往企業已經實現了很多服務, 構成了面向服務的架構,也就是我們常說的SOA. 服務的參與雙方都必須建立1對1 的聯系,讓我們回顧一下SOA架構有

Linux中 /boot 目錄介紹【轉載】

cond 備份 ges 直接 modprobe 虛擬人員完成 linux中 Linux中 /boot 目錄介紹轉自：點擊打開鏈接一、/boot/目錄中的文件和目錄 Linux系統在本地啟動時，目錄/boot/非常重要，其中的文件和目錄有：

【轉載】【Pycharm編輯器破解步驟】之idea和Pycharm 等系列產品激活激活方法和激活碼

ipc 有效路徑 FQ wsh sim 圖片放置 faq 感謝：雪中皓月的《idea和Pycharm 等系列產品激活激活方法和激活碼》第一種方法：使用現有的註冊服務器優點：快捷，方便，省事缺點：經常被封殺，可能會面臨經常激活的困擾 License Server:

【轉載】介紹 Firefox 多開的方法

【轉載自】https://segmentfault.com/a/1190000012600431 作為開發人員，在開發 Web 專案的時候免不了要開啟瀏覽器測試一下，而如果某個功能需要多個帳號進行測試，那麼來回切換登入也是夠麻煩的。如果可以開啟多個 Firefox 視窗，同時用不同的身份登入操作

【轉載】Elasticsearch－基礎介紹及索引原理分析

ES基礎資料結構分析的非常透徹，倒排索引，跳錶，壓縮技巧，聯合索引等轉載：https://www.cnblogs.com/dreamroute/p/8484457.html 最近在參與一個基於Elasticsearch作為底層資料框架提供大資料量(億級)的實時統計查詢的方案設計工作，花

【轉載】Qt入門與提高：K02-01通過簡單exe介紹pro基本配置

版權宣告 --------------------------------------------------------------------------------------------------------------------- 作者：女兒叫老白

【Mac + Python + Selenium】之PyCharm配置Selenium自動化【轉載】【Pycharm編輯器破解步驟】之idea和Pycharm 等系列產品啟用啟用方法和啟用碼（附：Mac系統） Python pip 命令不識別

一、安裝PyCharm 1、下載地址： Pycharm編輯器官網下載地址 2、安裝完成之後開啟，一路下去點選，直到填寫註冊碼，參考：《【轉載】【Pycharm編輯器破解步驟】之idea和Pycharm 等系列產品啟用啟用方法和啟用碼（附：Mac系統）》二、配置Python環境並安

【轉載】Hadoop產品介紹

【轉載】Hadoop產品介紹

【轉載】Hadoop 2.7.3 和Hbase 1.2.4安裝教程

【轉載】WEBRTC基本介紹

【轉載】HTML語法介紹

【轉載】CSS基本介紹

【轉載】大牛很通俗地介紹《信號與系統》

Hadoop（四）HDFS集群詳解【轉載】

Hadoop（一）之初識大數據與Hadoop【轉載】

【轉載】企業服務總線Enterprise service bus介紹

Linux中 /boot 目錄介紹【轉載】

【轉載】【Pycharm編輯器破解步驟】之idea和Pycharm 等系列產品激活激活方法和激活碼

【轉載】介紹 Firefox 多開的方法

【轉載】Elasticsearch－基礎介紹及索引原理分析

【轉載】Qt入門與提高：K02-01通過簡單exe介紹pro基本配置

【Mac + Python + Selenium】之PyCharm配置Selenium自動化【轉載】【Pycharm編輯器破解步驟】之idea和Pycharm 等系列產品啟用啟用方法和啟用碼（附：Mac系統） Python pip 命令不識別

【轉載】通過金礦模型介紹動態規劃 (動態規劃入門)

【轉載】徐國洪：好耶向移動廣告技術產品轉型

vmstat/iostat/strace/lsof等命令介紹【轉載】

【轉載】Flume學習之路（一）Flume的基礎介紹

因果圖法的介紹與示例分析【轉載】

【轉載】Hadoop產品介紹

相關推薦