Scala高級語法-1

阿新 • • 發佈：2019-05-01

shell 生態圈登錄密碼 graphx https 準備工作 submit ive

Spark課堂筆記

Spark生態圈：
Spark Core ： RDD（彈性分布式數據集）
Spark SQL
Spark Streaming
Spark MLLib：協同過濾，ALS，邏輯回歸等等 --> 機器學習
Spark Graphx ：圖計算

重點在前三章

-----------------Spark Core------------------------
一、什麽是Spark？特點？
https://spark.apache.org/
Apache Spark™ is a unified analytics engine for large-scale data processing.

特點：快、易用、通用性、兼容性（完全兼容Hadoop）

快：快100倍（Hadoop 3 之前）
易用：支持多種語言開發
通用性：生態系統全。
易用性：兼容Hadoop

spark 取代 Hadoop

二、安裝和部署Spark、Spark 的 HA

1、spark體系結構
Spark的運行方式

Yarn

Standalone：本機調試（demo）

Worker：從節點。每個服務器上，資源和任務的管理者。只負責管理一個節點。

執行過程：
一個Worker 有多個 Executor。 Executor是任務的執行者，按階段（stage）劃分任務。————> RDD

客戶端：Driver Program 提交任務到集群中。

1、spark-submit
2、spark-shell

2、spark的搭建
（1）準備工作：JDK 配置主機名免密碼登錄
（2）偽分布式模式
在一臺虛擬機上模擬分布式環境（Master和Worker在一個節點上）

export JAVA_HOME=/usr/java/jdk1.8.0_201
export SPARK_MASTER_HOST=node3
export SPARK_MASTER_PORT=7077

Scala高級語法-1

shell 生態圈登錄密碼 graphx https 準備工作 submit ive Spark課堂筆記 Spark生態圈：Spark Core ： RDD（彈性分布式數據集）Spark SQLSpark StreamingSpark MLLib：協同過濾，ALS，邏

Scala高級語法-1

Scala高級語法-1

Scala高級語法

python的一些高級語法

scala 高級十六 scala 集合和集合的高級特性 map flatten fllatmap zip reduce zip 等操作

scala 高級十八 scala隱式方法，隱式參數的實現和使用

javascript高級語法三

Day7 - 面向對象高級語法

Oracle 高級查詢1 關聯查詢分組查詢

高級語法

SQL高級教程1

Oracle_高級功能(1) 數據庫設計

Git入門到高級系列1-git安裝與基礎命令

Python高級語法之：一篇文章了解yield與Generator生成器

10.1.5 Comment類型【JavaScript高級程序設計第三版】

Ajax與Comet-JavaScript高級程序設計第21章讀書筆記(1)

《UNIX環境高級編程》讀書筆記之系統數據文件和信息（1）

Scala入門到精通——第二十二節高級類型（一）

Scala入門到精通——第二十四節高級類型（三）

javascript 高級程序設計學習筆記（1）

《互聯網企業安全高級指南》讀書筆記1-5

Scala高級語法-1

相關推薦