第一節 Scala語言初步
- Scala簡介
- 為什麼要學習Scala
- Scala語言初步
1. Scala簡介
Scala(Scala Language的簡稱)語言是一種能夠運行於JVM和.Net平臺之上的通用程式語言,既可用於大規模應用程式開發,也可用於指令碼程式設計,它由由Martin
Scala的建立者——Martin Odersk
在Scala的建立之初,並沒有怎麼引起重視,隨著Apache Spark和Apache Kafka這樣基於Scala的大資料框架的崛起,Scala逐步映入大資料從業者的眼簾。Scala的擁護者們認為Scala的主要優勢是速度和它的表達性。目前使用scala的作為支撐公司開發語言的包括Foursquare和Twitter。2009年Twitter把大部分後臺系統的開發語言從Ruby換成了Scala。參見這篇文章:Twitter on Scala: A Conversation with Steve Jenson, Alex Payne, and Robey Pointer,” Scalazine, April 3,2009, www.artima.com/scalazine/articles/twitter_on_scala.html.
1 純面向物件程式語言
- (1) Encapsulation/information hiding.
- (2)Inheritance.
- (3)Polymorphism/dynamic binding.
- (4)All predefined types are objects.
- (5) All operations are performed by sending messages to objects.
- (6)All user-defined types are objects.
2 函數語言程式設計語言
定義:Functional programming is a programming paradigm that treats computation as the evaluation of mathematical functions and avoids state and mutable data.
(1)高階函式(Higher-order functions)
(2)閉包( closures)
(3)模式匹配( Pattern matching)
(4)單一賦值( Single assignment )
(5)延遲計算( Lazy evaluation)
(6)型別推導( Type inference )
(7)尾部呼叫優化( Tail call optimization)
(8)型別推導( Type inference )
3 Scala語言具有很強的相容性、移植性
4 Scala語法的簡潔
下面給的是java的Hadoop wordcount程式碼及Spark wordcount程式碼
可以看到,spark三行程式碼就解決了hadoop 七八十行程式碼做的事情。
2. 為什麼要學習Scala
1 開源大資料記憶體計算框架Spark的流行
- Spark是當前最流行的開源大資料記憶體計算框架,採用Scala語言實現,由UC 伯克利大學AMPLab實驗室開發(2009)並於2010年開源,在2014年成為Apache基金會的頂級專案http://spark.apache.org/
- Spark有著很好的效能優勢。
圖片來源:databricks.com/blog/2014/11/05/spark-officiallysets-a-new-record-in-large-scale-sorting.html -
圖片來源:Real-Time Analytics with Spark Streaming
圖片來源:Spark Summit 2015
圖片來源:twitter.com/dberkholz/status/568561792751771648 -
圖片來源:Summit Spark 2015 https://spark-summit.org/2015/
- IBM 百萬資料工程師計劃
【2015年6月17日,北京】IBM(NYSE:IBM)宣佈承諾大力推進Apache Spark專案,並稱該專案為:在以資料為主導的,未來十年最為重要的新的開源專案。這一承諾的核心是將Spark嵌入IBM業內領先的分析和商務平臺,並將Spark作為一項服務,在IBM Bluemix平臺上提供給客戶。IBM還將投入超過3500名研究和開發人員在全球十餘個實驗室開展與Spark相關的專案,並將為Spark開源生態系統無償提供突破性的機器學習技術——IBM
2 Scala是未來大資料處理的主流語言
- 它是Spark框架的開發語言
- ”If I were to pick a language to use today other than Java, it would be Scala.” —James Gosling
詹姆斯·高斯林 Java之父
- ”If I were to pick a language to use today other than Java, it would be Scala.” —James Gosling
3. Scala語言初步
1 變數定義
//與java final關鍵字宣告的變數一樣
scala> val helloString="Hello World"
helloString: String = Hello World
scala> val helloString:String="Hello World"
helloString: String = Hello World
scala> val helloString:java.lang.String="Hello World"
helloString: String = Hello World
scala> helloString="Hello Crazy World"
<console>:8: error: reassignment to val
helloString="Hello Crazy World"
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
scala> lazy val helloString="Hello Crazy World"
helloString: String = <lazy>
scala> helloString
res1: String = Hello Crazy World
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
//var 宣告可變變數
scala> var helloString="Hello Cruel World"
helloString: String = Hello Cruel World
scala> helloString="GoodBye Cruel World"
helloString: String = GoodBye Cruel World
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
2 函式初步
scala> def add(a:Int,b:Int):Int={return a+b}
add: (a: Int, b: Int)Int
scala> add(1,2)
res3: Int = 3
scala> def add(a:Int,b:Int):Int={a+b}
add: (a: Int, b: Int)Int
scala> def add(a:Int,b:Int)={a+b}
add: (a: Int, b: Int)Int
scala> add(1,2)
res4: Int = 3
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
3 HelloWorld應用程式:
package cn.xtwy.scala.chapter01
object HelloWorld {
def main(args: Array[String]): Unit = {
println("Hello World")
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9