1. 程式人生 > >Hadoop基礎與電商行為日誌分析 新手入門大數據

Hadoop基礎與電商行為日誌分析 新手入門大數據

文件系統 空間 tar ddl 百度網 框架 mapr ... 分布式文件系

第1章 大數據概述
本章將從故事說起,讓大家明白大數據是與我們的生活息息相關的,並不是遙不可及的,還會介紹大數據的特性,以及大數據對我們帶來的技術變革,大數據處理過程中涉及到的技術以及大數據典型應用。

第2章 初識Hadoop
本章節將帶領大家認識Hadoop以及Hadoop生態系統、Hadoop的發展史、Hadoop的優勢、Hadoop的三個核心組件、Hadoop發行版的選擇,為後續深入講解Hadoop打下堅實的基礎。

第3章 分布式文件系統HDFS
本章將從Hadoop的設計目標、架構及文件系統命令空間出發,快速搭建單節點偽分布式HDFS的實驗環境,通過講解使用hdfs shell以及Java API的方式操作HDFS文件系統,詳細分析HDFS文件的讀寫流程,並通過HDFS API來實現詞頻統計案例,使得大家對Hadoop分布式文件系統HDFS有深刻的認識以及實戰。 ...


第4章 分布式計算框架MapReduce
本章將從架構、編程模型等角度帶大家認識Hadoop的分布式計算框架MapReduce,掌握MapReduce各個核心組件編程,並通過兩個案例讓大家深入掌握MapReduce編程的方方面面。

第5章 資源調度框架YARN
本章將從YARN的產生背景、YARN的架構及執行流程的角度帶大家認知Hadoop的資源調度框架YARN,快速搭建單節點偽分布式YARN的實驗環境並掌握如何提交MapReduce作業提交到YARN上運行。

第6章 電商項目實戰Hadoop實現
本章將通過電商用戶行為日誌分析的項目實戰,來將前面幾個章節講解的知識點串聯起來,綜合使用Hadoop的技術進行離線統計分析。

第7章 數據倉庫Hive
本章將從Hive的產生背景、體系架構、Hive部署、DDL以及DML來掌握Hive使用的方方面面。

第8章 電商項目實戰Hive實現
本章將使用Hive對電商用戶行為日誌分析進行重新實現,讓大家對MapReduce編程和Hive實現的方式進行對比,體會Hive在生產上使用的便捷性。

第9章 Hadoop分布式集群搭建
本章將帶領大家搭建一個三個節點的分布式Hadoop集群環境,讓大家對於Hadoop集群的安裝有更深入的認識,並將項目實戰案例運行在分布式集群環境中。

下載地址:百度網盤下載

Hadoop基礎與電商行為日誌分析 新手入門大數據