1. 程式人生 > 程式設計 >Scala函數語言程式設計專題--scala集合和函式

Scala函數語言程式設計專題--scala集合和函式

前情提要:

Scala函數語言程式設計指南(一) 函式式思想介紹

scala函數語言程式設計(二) scala基礎語法介紹

前面已經稍微介紹了scala的常用語法以及面向物件的一些簡要知識,這次是補充上一章的,主要會介紹集合和函式。

注意噢,函式和方法是不一樣的,方法是在類裡面定義的,函式是可以單獨存在的(嚴格來說,在scala內部,每個函式都是一個類)

一.scala集合介紹

還記得上一章介紹的object的apply方法嗎,很多資料結構其實都用到了它,從而讓我們可以直接用List(...)這樣來新建一個List,而不用自己手動new一個。

PS:注意,scala預設的資料結構都是不可變的,就是說一個List,沒法刪除或增加新的元素。當然,也有“可變”的資料結構,後面會介紹到。

1.1 List

得益於apply方法,我們可以不通過new來新建資料結構。

//通過工廠,新建一個List,這個List是不可變的
scala> val numbers = List(1,2,3,4,5,1,5)
numbers: List[Int] = List(1,5)

1.2 元組Tuple

Tuple這個概念在python應用比較廣泛,它可以將多種資料型別(Int,String,Double等)打包在一起

scala> val tup = (1,2.1,"tuple",'c') //將多種不同資料結構打包一起,可以有重複
tup: (Int,Int,Double,Char) = (1,tuple,c)

但在scala中,Tuple是有長度限制的,那就是一個Tuple最多隻能有22個元素。

scala> val tup = (0,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21)
tup: (Int,Int) = (0,21)

//一個Tuple超過22個元素,報錯了
scala> val tup = (0,21,22)
<console>:1: error: too many elements for tuple: 23,allowed: 22
val tup = (0,22)

可以看到上面,一但一個Tuple超過22個元素,就會報錯了。至於為什麼是22這個神奇的數字,好像一直沒有一個統一的論調。有人開玩笑的說23才對,因為有部電影的名字叫《The Number 23》~~

1.3 Map和Option

在說Map之前,需要先介紹Option,因為Map裡面存的就是Option,這個後面介紹。

Option翻譯過來是選項,本質上,它也確實是一個選項,用來告訴你存不存在。還是用例項說明吧:

//Option裡面可以存普通資料型別
scala> val optionInt = Option(1)
optionInt: Option[Int] = Some(1)

scala> optionInt.get
res8: Int = 1
//但一個Option也可能為空
scala> val optionNone = Option(null)
optionNone: Option[Null] = None
//當Option裡面是空的時候,是get不出東西的,還會報錯
scala> optionNone.get
java.util.NoSuchElementException: None.get
 at scala.None$.get(Option.scala:347)
 at scala.None$.get(Option.scala:345)
 ... 32 elided
//這個時候可以判斷它就是空的
scala> optionNone.isEmpty
res11: Boolean = true
//但可以用getOrElse()方法,當Option裡面有東西的時候,就返回那個東西,如果沒有東西,就返回getOrElse()的引數的內容
scala> optionNone.getOrElse("this is null") //裡面沒東西
res12: String = this is null
scala> optionInt.getOrElse("this is null") //裡面有東西
res15: Any = 1

再說Map,Map裡面的value的型別並不是你賦的那個資料型別,而是Option。即Map(key -> Option,key1 -> Option)。

scala> val map = Map("test1" -> 1,"test2" -> 2)
map: scala.collection.immutable.Map[String,Int] = Map(test1 -> 1,test2 -> 2)

scala> map.get("test1")
res16: Option[Int] = Some(1)

scala> map.get("test3")
res17: Option[Int] = None

scala> map.get("test3").getOrElse("this is null")
res18: Any = this is null

這樣的好處是什麼呢?還記得在java裡面,每次都得為java為空的情況做判斷的痛苦嗎。在scala,這些煩惱通通不存在。有了Option,媽媽再也不用擔心NullPointerException啦。

1.4 常用函式組合子

匿名函式

將集合的函式組合子,那肯定得先將匿名函式。如果有用過python中的lambda表示式,那應該就很瞭解這種方式了。

前面說到,在scala中,函式就是物件,匿名函式也是函式。舉個簡單的例子:

//建立一個匿名函式
scala> val addOne = (x: Int) => x + 1
addOne: (Int) => Int = <function1>

scala> addOne(1)
res4: Int = 2

注意,函式裡面是可以不用return的,最後面的那個x+1就是匿名函式的返回值了。

map,reduce

因為hadoop的出現,MapReduce都被說爛了。雖然Hadoop的Mapreduce起源自函式式的map和reduce,但兩者其實是不一樣的。感興趣的可以看看我之前寫過的一篇:從分治演算法到 Hadoop MapReduce

函式式裡面的map呢,粗略的說,其實相當一個有返回值的for迴圈。

scala> val list = List(1,3)
list: List[Int] = List(1,3)

scala> list.map(_ + 1)  //這裡的(_+1)其實就是一個匿名函式 //讓List中每一個元素+1,並返回
res29: List[Int] = List(2,4)

至於reduce呢,也是像for迴圈,只是不像map每次迴圈是當前元素,reduce除了當前元素,還有上一次迴圈的結果,還是看看例子吧:

scala> list.reduce((i,j) => i + j) //兩個兩個一起迴圈,這裡是讓兩個相加
res28: Int = 6

比如上面的例子,有1,3三個數。第一次迴圈的兩個是1,2,1+2就等於3,第二次迴圈就是上次的結果3和原本的3,3+3等於6,結果就是6。

filter

filter故名思意,就是過濾的意思,可以在filter中傳進去一個匿名函式,返回布林值。返回true的則保留,返回false的丟棄。

scala> val numbers = List(1,4)
numbers: List[Int] = List(1,4)

//過濾出餘2等於0的
scala> numbers.filter((i: Int) => i % 2 == 0)
res0: List[Int] = List(2,4)

foldLeft

這個和reduce類似,也是遍歷,除了當前元素,還有上一次迭代的結果。區別在於foldLeft有一個初始值。

scala> val numbers = List(1,4)

//(m: Int,n: Int) => m + n這部分是一個匿名函式
scala> numbers.foldLeft(0)((m: Int,n: Int) => m + n)
res30: Int = 10

二.scala函式

在最前面有介紹到,函式就是物件。那為什麼函式能直接執行呢?這其實得益於object的apply這個語法糖。

偏函式

偏函式(PartialFunction),從某種意義上來說,偏函式也是scala中挺重要的一個語法糖。

偏函式它長這樣:

PartialFunction[A,B] //接收一個A型別的引數,返回B型別的引數

值得一提的是,scala中有一個關鍵字case,就是使用偏函式。繼續舉例子:

//下面的case就是一個偏函式PartialFunction[Int,String]
scala> val one: PartialFunction[Int,String] = { case 1 => "one" }
one: PartialFunction[Int,String] = <function1>

scala> one(1)
res11: String = Int

scala> one("one")
<console>:13: error: type mismatch;
 found  : String("one")
 required: Int
    one("one")

case關鍵字會匹配符合條件的型別或值,如果不符合,會報錯。內部實現就不介紹了,知道是個常用語法糖就好。

而這個case關鍵字也正是實現scala模式匹配中,必不可少的一環,有興趣的童鞋可以看看我這篇:scala模式匹配詳細解析

這裡再說一個常見應用吧,函式組合子中有一個collect,它需要的引數就是一個偏函式。下面看個有意思的例子:

//這個list裡面的Any型別
scala> val list:List[Any] = List(1,"seven")
list: List[Any] = List(1,seven)

//使用map會報錯,因為map接收的引數是普通函
scala> list.map { case i: Int => i + 1 }
scala.MatchError: seven (of class java.lang.String)
 at $anonfun$1.apply(<console>:13)
 at $anonfun$1.apply(<console>:13)
 at scala.collection.immutable.List.map(List.scala:277)
 ... 32 elided

 //但如果用collect函式就可以,因為collect接收的引數是偏函式,它會自動使用偏函式的一些特性,所以可以自動過濾掉不符合的資料型別
scala> list.collect { case i: Int => i + 1 }
res15: List[Int] = List(2,6)

因為collect接收的引數是偏函式,它會自動使用偏函式的特性,自動過濾不符合的資料型別,而map就做不到。

部分應用函式

所謂部分應用的意思,就是說,當呼叫一個函式時,可以僅傳遞一部分引數。而這樣會生成一個新的函式,來個例項看看吧:

//定義一個列印兩個輸出引數的函式
scala> def partial(i:Int,j:Int) : Unit = {
   |   println(i)
   |   println(j)
   | }
partial: (i: Int,j: Int)Unit

//賦一個值給上面那個函式,另一個引數不賦值,生成一個新的函式
scala> val partialFun = partial(5,_:Int)
partialFun: Int => Unit = <function1>

//只要一個引數就可以呼叫啦
scala> partialFun(10)
5
10

部分應用函式,主要是作用是程式碼複用,同時也能夠增加一定的程式碼可讀性。

當然還有更多有意思的用法,後面有機會說到再說。

函式柯里化

剛開始,聽到柯里化的時候很奇怪。柯里?啥玩意?

後來才知道,其實柯里是從curry音譯過來的,這個是個人名,就是發明了柯里化的發明人。

柯里化是把接受多個引數的函式變換成接受一個單一引數(最初函式的第一個引數)的函式,並且返回接受餘下的引數且返回結果的新函式的技術。

看看具體是怎麼使用吧:

//我們知道函式可以這樣定義,讓它接收兩個引數
scala> def curring(i:Int)(j: Int): Boolean = {false}
curring: (i: Int)(j: Int)Boolean

//可以把這個函式賦值給一個變數,注意變數的型別
scala> val curringVal:(Int => (Int => Boolean)) = curring _
curringVal: Int => (Int => Boolean) = <function1>

//可以讓這個變數接收一個引數,又變成另一個函數了
scala> val curringVal_1 = curringVal(5)
curringVal_1: Int => Boolean = <function1>

//再用這個變數接收一個引數,終於能返回結果了
scala> curringVal_1(10)
res32: Boolean = false

柯里化其實是把一個函式變成一個呼叫鏈的過程,和上面的部分應用函式看起來有點像。

這幾個部分初次看可能不知道它究竟有什麼用,其實這些功能的一個主要用途是函式式的依賴注入。通過這部分技術可以把被依賴的函式以引數的形式傳遞給上層函式。限於篇幅這裡就先省略,後面再介紹。

結語:

此次介紹的是scala集合的一些內容,以及一些函式的特性,再說一遍,函式其實就是物件。

我一直有一種觀點,在學習新的東西的時候,一些偏固定規則的東西,比如語法。不用全部記熟,只要知道大概原理,有個映像就行。

比如說scala的函數語言程式設計,或是java的OOP,不需要抱有先把語法學完,再學習相關的程式設計理念,這在我看來是有點本末倒置了。

我一般的做法,是先熟悉大概的語法,然後去學習語言的精髓。當碰到不懂的時候,再反過來查詢具體的語法,有了目標之後,語法反而變得不是那麼枯燥了。

以上只是我的一些個人看法,那麼本篇到此就結束了。

到此這篇關於Scala函數語言程式設計專題--scala集合和函式的文章就介紹到這了,更多相關scala函數語言程式設計內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!