零基礎轉行大資料怎麼學習？大資料學習路線

阿新 • • 發佈：2018-11-25

大資料的領域非常廣泛，往往使想要開始學習大資料及相關技術的人望而生畏。大資料技術的種類眾多，這同樣使得初學者難以選擇從何處下手。希望能為你開始學習大資料的征程提供幫助，以及在大資料產業領域找到工作指明道路。

一、大資料技術基礎

1、linux操作基礎

· linux系統簡介與安裝

· linux常用命令–檔案操作

· linux常用命令–使用者管理與許可權

· linux常用命令–系統管理

· linux常用命令–免密登陸配置與網路管理

· linux上常用軟體安裝

· linux本地yum源配置及yum軟體安裝

· linux防火牆配置

· linux高階文字處理命令cut、sed、awk

· linux定時任務crontab

2、shell程式設計

· shell程式設計–基本語法

· shell程式設計–流程控制

· shell程式設計–函式

· shell程式設計–綜合案例–自動化部署指令碼

3、記憶體資料庫redis

· redis和nosql簡介

· redis客戶端連線

· redis的string型別資料結構操作及應用-物件快取

· redis的list型別資料結構操作及應用案例-任務排程佇列

· redis的hash及set資料結構操作及應用案例-購物車

· redis的sortedset資料結構操作及應用案例-排行榜

4、布式協調服務zookeeper

· zookeeper簡介及應用場景

· zookeeper叢集安裝部署

· zookeeper的資料節點與命令列操作

· zookeeper的java客戶端基本操作及事件監聽

· zookeeper核心機制及資料節點

· zookeeper應用案例–分散式共享資源鎖

· zookeeper應用案例–伺服器上下線動態感知

· zookeeper的資料一致性原理及leader選舉機制

5、java高階特性增強

· Java多執行緒基本知識

· Java同步關鍵詞詳解

· java併發包執行緒池及在開源軟體中的應用

· Java併發包訊息隊裡及在開源軟體中的應用

· Java JMS技術

· Java動態代理反射

6、輕量級RPC框架開發

· RPC原理學習

· Nio原理學習

· Netty常用API學習

· 輕量級RPC框架需求分析及原理分析

· 輕量級RPC框架開發

二、離線計算系統

1、hadoop快速入門

· hadoop背景介紹

· 分散式系統概述

· 離線資料分析流程介紹

· 叢集搭建

· 叢集使用初步

2、HDFS增強

· HDFS的概念和特性

· HDFS的shell(命令列客戶端)操作

· HDFS的工作機制

· NAMENODE的工作機制

· java的api操作

· 案例1：開發shell採集指令碼

3、MAPREDUCE詳解

· 自定義hadoop的RPC框架

· Mapreduce程式設計規範及示例編寫

· Mapreduce程式執行模式及debug方法

· mapreduce程式執行模式的內在機理

· mapreduce運算框架的主體工作流程

· 自定義物件的序列化方法

· MapReduce程式設計案例

4、MAPREDUCE增強

· Mapreduce排序

· 自定義partitioner

· Mapreduce的combiner

· mapreduce工作機制詳解

5、MAPREDUCE實戰

· maptask並行度機制-檔案切片

· maptask並行度設定

· 倒排索引

· 共同好友

6、federation介紹和hive使用

· Hadoop的HA機制

· HA叢集的安裝部署

· 叢集運維測試之Datanode動態上下線

· 叢集運維測試之Namenode狀態切換管理

· 叢集運維測試之資料塊的balance

· HA下HDFS-API變化

· hive簡介

· hive架構

· hive安裝部署

· hvie初使用

7、hive增強和flume介紹

· HQL-DDL基本語法

· HQL-DML基本語法

· HIVE的join

· HIVE 引數配置

· HIVE 自定義函式和Transform

· HIVE 執行HQL的例項分析

· HIVE最佳實踐注意點

· HIVE優化策略

· HIVE實戰案例

· Flume介紹

· Flume的安裝部署

· 案例：採集目錄到HDFS

· 案例：採集檔案到HDFS

三、流式計算

1、Storm從入門到精通

· Storm是什麼

· Storm架構分析

· Storm程式設計模型、Tuple原始碼、併發度分析

· Storm WordCount案例及常用Api分析

· Storm叢集部署實戰

· Storm+Kafka+Redis業務指標計算

· Storm原始碼編譯

· Strom叢集啟動及原始碼分析

· Storm任務提交及原始碼分析

· Storm資料傳送流程分析

· Storm通訊機制分析

· Storm訊息容錯機制及原始碼分析

· Storm多stream專案分析

· 編寫自己的流式任務執行框架

2、Storm上下游及架構整合

· 訊息佇列是什麼

· Kakfa核心元件

· Kafka叢集部署實戰及常用命令

· Kafka配置檔案梳理

· Kakfa JavaApi學習

· Kafka檔案儲存機制分析

· Redis基礎及單機環境部署

· Redis資料結構及典型案例

· Flume快速入門

· Flume+Kafka+Storm+Redis整合

四、記憶體計算體系Spark

1、scala程式設計

· scala程式設計介紹

· scala相關軟體安裝

· scala基礎語法

· scala方法和函式

· scala函數語言程式設計特點

· scala陣列和集合

· scala程式設計練習（單機版WordCount）

· scala面向物件

· scala模式匹配

· actor程式設計介紹

· option和偏函式

· 實戰：actor的併發WordCount

· 柯里化

· 隱式轉換

2、AKKA與RPC

· Akka併發程式設計框架

· 實戰：RPC程式設計實戰

3、Spark快速入門

· spark介紹

· spark環境搭建

· RDD簡介

· RDD的轉換和動作

· 實戰：RDD綜合練習

· RDD高階運算元

· 自定義Partitioner

· 實戰：網站訪問次數

· 廣播變數

· 實戰：根據IP計算歸屬地

· 自定義排序

· 利用JDBC RDD實現資料匯入匯出

· WorldCount執行流程詳解

4、RDD詳解

· RDD依賴關係

· RDD快取機制

· RDD的Checkpoint檢查點機制

· Spark任務執行過程分析

· RDD的Stage劃分

5、Spark-Sql應用

· Spark-SQL

· Spark結合Hive

· DataFrame

· 實戰：Spark-SQL和DataFrame案例

6、SparkStreaming應用實戰

· Spark-Streaming簡介

· Spark-Streaming程式設計

· 實戰：StageFulWordCount

· Flume結合Spark Streaming

· Kafka結合Spark Streaming

· 視窗函式

· ELK技術棧介紹

· ElasticSearch安裝和使用

· Storm架構分析

· Storm程式設計模型、Tuple原始碼、併發度分析

· Storm WordCount案例及常用Api分析

7、Spark核心原始碼解析

· Spark原始碼編譯

· Spark遠端debug

· Spark任務提交行流程原始碼分析

· Spark通訊流程原始碼分析

· SparkContext建立過程原始碼分析

· DriverActor和ClientActor通訊過程原始碼分析

· Worker啟動Executor過程原始碼分析

· Executor向DriverActor註冊過程原始碼分析

· Executor向Driver註冊過程原始碼分析

· DAGScheduler和TaskScheduler原始碼分析

· Shuffle過程原始碼分析

· Task執行過程原始碼分析

五、機器學習演算法

1、python及numpy庫

· 機器學習簡介

· 機器學習與python

· python語言–快速入門

· python語言–資料型別詳解

· python語言–流程控制語句

· python語言–函式使用

· python語言–模組和包

· phthon語言–面向物件

· python機器學習演算法庫–numpy

· 機器學習必備數學知識–概率論

2、常用演算法實現

· knn分類演算法–演算法原理

· knn分類演算法–程式碼實現

· knn分類演算法–手寫字識別案例

· lineage迴歸分類演算法–演算法原理

· lineage迴歸分類演算法–演算法實現及demo

· 樸素貝葉斯分類演算法–演算法原理

· 樸素貝葉斯分類演算法–演算法實現

· 樸素貝葉斯分類演算法–垃圾郵件識別應用案例

· kmeans聚類演算法–演算法原理

· kmeans聚類演算法–演算法實現

· kmeans聚類演算法–地理位置聚類應用

· 決策樹分類演算法–演算法原理

· 決策樹分類演算法–演算法實現

以上大資料學習線路圖僅供大家參考

零基礎轉行大資料怎麼學習？大資料學習路線

大資料的領域非常廣泛，往往使想要開始學習大資料及相關技術的人望而生畏。大資料技術的種類眾多，這同樣使得初學者難以選擇從何處下手。希望能為你開始學習大資料的征程提供幫助，以及在大資料產業領域找到工作指明道路。一、大資料技術基礎 1、linux操作基礎 · linux系統簡介與安裝 ·

零基礎怎麼學spark？大資料開發學習

隨著大資料時代的到來。各種技術衍生，市場工作崗位的需求越亦增長。今天科多大資料挑選大資料裡高頻技術詞彙“spark”跟大家分享。 spark 如何入手？概述 Apache Spark是一個快速和通用的叢集計算系統。它提供Java，scala,Python、R語言的APIs，以及支援一

零基礎轉行大資料工程師艱辛歷程記！看了讓我感慨萬千

我們相信人人都可以成為一個大資料程式設計師，現在開始，找個師兄，帶你入門，學習的路上不再迷茫。不少想進入大資料行業的零基礎學員經常會有這樣一些疑問：零基礎應該怎麼學習？自己適合學習大資料嗎？人生，就是在不斷地做選擇，然後在這個選

零基礎轉行資料分析師可以嗎？需要學習什麼？

大資料的發展使得很多人看到了未來發展的趨勢，於是紛紛想去資料分析行業中分一杯羹，但是想進入資料分析行業沒有一身過硬的本事是不可能的，就算進入的資料分析行業，也會被打回原形，從而被淘汰。於是很多人比較關心如果我想轉行進入資料分析師行業，需要學習什麼知識，如果我基礎很差甚至是零基礎，這又該如何是好？估計這給很

小判官教你零基礎入門量化投資，大資料分析

學習量化投資和大資料分析，首先你得具備一定的數學基礎、統計學基礎，經濟學基礎以及物理較好一定的程式設計能力（最好是學python，入門快，效率高），如果這些基礎你都不具備，沒關係，說好的零基礎入門，那就跟著我一步一步的走。一. 數學打好數學基礎，學一學集合論

【大資料新手上路】“零基礎”系列課程--如何通過大資料開發套件Data IDE玩轉大資料

本教程是一個大資料開發套件Data IDE零基礎教程，通過Data IDE將多源異構的資料集匯入雲端MaxCompute，進行計算、分析；然後通過Data IDE系統排程定時處理，最終，通過Quick BI實現企業T-1天的業務報表及分析；

大牛告訴你零基礎轉行學Python的發展前景！

大家都知道，Python現在已經是程式語言之王了。那麼，Python到底為什麼這麼牛？哪些優勢戰勝了其他語言？另外，Python的就業前景怎麼樣？有哪些就業崗位？學Python有發展前景嗎? 很多人看現在python那麼火都想學一學，但也在疑惑學這個到底有沒有發展前景，下面就趕

Python零基礎，從草根到大神的入門筆記，學習效果非常不錯！

正所謂“人生苦短，我用Python”，而Python的設計哲學就是“優雅”、“明確”、“簡單”。 image 基礎（變數和字串） image image image 在這裡還是要推薦下我自己建的Python開發學習群:943752371，群裡都是學Py

零基礎轉行Linux雲計算運維工程師獲得20萬年薪的超級學習技巧

Linux Linux運維 Linux入門雲計算概念一旦產生便一發不可收拾，成為移動互聯網時代最為火熱的行業之一。國內各大互聯網公司例如阿裏、騰訊、百度、網易等紛紛推出自己的雲計算產品，3月10日，騰訊雲0.01元投標時間更是讓雲計算在普羅大眾中火熱了一把！隨著雲計算的產生，運維工程師也迎來了職

零基礎轉行學python（學習方法，學習效率，如何就業）你要了解

個人提醒大家幾點一：盲目的去學當初我在對於python這個行業什麼都不瞭解的情況下，比如：不知道未來發展趨勢，不知道學習python應該注意哪些初始問題，不知道具體的學習規劃學習路線等等，一味的買書看書，看視訊，到了中期階段萌生放棄的想法，和主要是因為覺得自己越學

零基礎轉行Linux雲端計算運維工程師獲得20萬年薪的超級學習技巧

雲端計算概念一旦產生便一發不可收拾，成為移動網際網路時代最為火熱的行業之一。國內各大網際網路公司例如阿里、騰訊、百度、網易等紛紛推出自己的雲端計算產品，騰訊雲0.01元投標時間更是讓雲端計算在普羅大眾中火熱了一把！隨著雲端計算的產生，運維工程師也迎來了職業的升級。傳統的運維工程師散佈在各個企業，在可見的將

乾貨推薦|教你使用爬蟲程式零基礎採集噹噹網商品銷售資料

“大資料”這一術語從2008年開始在科技領域中出現，隨之引起學術界的廣泛研究興趣。《Nature》與《Science》雜誌分別出版專刊，從網際網路技術、網際網路經濟學、超級計算、環境科學、生物醫藥等多個方面討論大資料處理和應用專題。世界各國政府也高度重視大資料領域的研究和探索，並從國家戰略的層面推出

零基礎轉行web前端，如何高效的去學習web前端

web前端開發要學的知識內容涉及的會很寬泛，雖然說主要是HTML、CSS和JavaScript這些基礎知識點，但學前端開發除了要學這些基礎知識外，學員還要在這之上進行延伸和深入的去學，而且網際網路時代不斷髮展，掌握了這些新技術、新技能，在職場的競爭力必然會翻倍提升。前端開發 1零基礎

零基礎轉行學習Java編程，有哪些學習方法可以借鑒

智慧交通 ice 一個智能移動互聯更多方式做網頁中國互聯網的加速發展，大概從1997年開始，前期是 PC 互聯網，後來移動互聯網，現在互聯網+，再接下來物聯網、智慧城市、智慧交通、人工智能，一路蓬勃發展，雖有小波折，大趨勢從未變過，未來一面泛化、一面深化，十年

零基礎轉行學習Python應該怎麼學，贈送福利

零基礎怎麽學Linux？Linux學習攻略

雲計算 Linux 學習攻略 ?不知道文章面前的你是怎樣計劃你的Linux學習的。如今有很多關於Linux的書籍，博客。大多數都會比較“粗暴“的將一大堆的命令塞給讀者，從而使很多Linux初學者望而卻步，未入其門就路過了。所以，×××老師就為希望踏入Linux之門的你，準備了一份攻略，要看看嗎？

如何從零基礎轉行大數據工程師暫獲年薪30W，看阿裏雲大牛怎麽說

hive 推薦系統用戶團隊協作好的並發處理爬蟲運用數據分析 2017年，科學，商業和有關部門使用大數據的速度將加快。在科學中，我們正在看到利用數據進行理論發展。在業務中，我們看到雲部署創造了新的效率，部署了預測分析來提高決策和效率。政府和法規側重於安全性，關鍵

我如何零基礎轉行成為一個自信的前端

來自未來的補充：原標題是“學前端，我如何在一年內學到三年的知識”。經網友批評和自己反思後，決定改一個合適點的標題。另外，有不少朋友以為我在國外，其實我一直在深圳。目前我也在想進入技術好一點的團隊，可打雜。這個大言不慚的標題源自我與我所認識的前端從業者的比較，也源自別人的評價。讀者也可以看我其它文章，評估我

零基礎轉行前端，一年工作經驗，我如何入職螞蟻金服

這個月我入職螞蟻金服了。兩年前當我決定轉行時，我都沒想到會這麼順利。上個月我發表了《我如何零基礎轉行成為一個自信的前端》。在這篇文章裡我詳述了我的學習方法和學習路徑。這一次我換一個角度，脫離實施細節，從更泛的層面談談怎樣提升自己的價值，並獲得別人的認可。一，建立自我品牌，等別人找你對於像我這樣簡歷

零基礎轉行學Python有發展前景嗎？

大家都知道，Python現在已經是程式語言之王了。那麼，Python到底為什麼這麼牛？哪些優勢戰勝了其他語言？另外，Python的就業前景怎麼樣？有哪些就業崗位？學Python有發展前景嗎? 很多人看現在python那麼火都想學一學，但也在疑惑學這個到底有沒有發展前

零基礎轉行大資料怎麼學習？大資料學習路線

相關推薦