1. 程式人生 > >基於Hadoop離線大數據分析平臺項目實戰

基於Hadoop離線大數據分析平臺項目實戰

網站 收集 har 配置 處理 com 數據分析 reduce yun

基於Hadoop離線大數據分析平臺項目實戰
網盤地址:https://pan.baidu.com/s/13vOi8WphetCiRtHhOCUdGg 密碼: kt99
備用地址(騰訊微雲):https://share.weiyun.com/5wdYJSk 密碼:jjmx9p

課程簡介:
某購物電商網站數據分析平臺,分為收集數據、數據分析和數據展示三大層面。其中數據分析主要依據大數據Hadoop生態系統常用組件進行處理,此項目真實的展現了大數據在企業中實際應用。

課程內容
(1)文件收集框架 Flume
①Flume 設計架構、原理(三大組件)
②Flume 初步使用,實時采集數據
③實際案例:使用Flume監控數據,實時收集存儲HDFS中

(2)大數據分析平臺架構
①數據平臺三大模塊
讓技術產生價值!
②分析平臺業務數據
③大數據平臺技術選型和搭建配置測試

(3)數據分析平臺七大業務分析
①具體的七大業務分析,針對不同的數據
②將數據收到 HDFS/Hive/HBase,使用MapReduce和Hive離線分析,其中涉及地域分析、用戶相關信息分析及外鏈分析等。
③依據業務深入MapReduce使用
④數據處理時,針對不同問題如何優化調整等

基於Hadoop離線大數據分析平臺項目實戰