1. 程式人生 > >Hadoop家族學習路線、實踐案例

Hadoop家族學習路線、實踐案例

detail 代碼 聯系 www gpo roadmap top a-z hcatalog

作者:Han Hsiao
鏈接:https://www.zhihu.com/question/19795366/answer/24524910
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。

推薦一些Hadoop家族系列文章,主要介紹Hadoop家族產品,常用的項目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的項目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

一、學習路線圖
  • Hadoop家族學習路線圖 開篇必讀
  • Hive學習路線圖
  • Mahout學習路線圖
二、編程實踐
  • Hadoop歷史版本安裝
  • 用Maven構建Hadoop項目
  • Hadoop編程調用HDFS
  • 用Maven構建Mahout項目
  • Mahout推薦算法API詳解
  • 用MapReduce實現矩陣乘法
  • 從源代碼剖析Mahout推薦引擎
  • Mahout分步式程序開發 基於物品的協同過濾ItemCF
  • Mahout分步式程序開發 聚類Kmeans
  • PageRank算法並行實現
三、案例分析
  • 海量Web日誌分析 用Hadoop提取KPI統計指標
  • 用Hadoop構建電影推薦系統
  • 用Mahout構建職位推薦引擎
  • Mahout構建圖書推薦系統
  • PeopleRank從社交網絡中發現個體價值

Hadoop家族學習路線、實踐案例