1. 程式人生 > >Scala 中 10 個超讚的集合操作函式

Scala 中 10 個超讚的集合操作函式

當我處理 Scala 集合時,我會進行兩類操作:轉換操作和聚合操作。第一種操作型別將集合轉換為另一個集合,第二種操作型別返回某些型別的值。

本文我將集中介紹幾個日常工作必備的 Scala 集合函式,如轉換函式和聚合函式。文章最後,我會展示如何結合這些函式以解決具體問題。

#1 最大值和最小值

我們先從動作函式開始。

在序列中查詢最大或最小值是一個極常見的需求,較常用於面試問題和演算法。還記得 Java 中的程式碼行嗎?如下:

int[] arr = {11, 2, 5, 1, 6, 3, 9}; 
int to = arr.length - 1; 
int max = arr[0]; 
for (int i = 0; i < to; i++) 
{ if (max < arr[i+1]) max = arr[i+1]; } 
System.out.println(max);

問題:怎麼在 List 中找到最大/最小值呢?

Scala 推薦了一個很讚的解決方案:

val numbers = Seq(11, 2, 5, 1, 6, 3, 9) 
  numbers.max //11 
  numbers.min //1

但實際操作的資料更加複雜。下面我們介紹一個更高階的例子,其中包含一個書的序列(檢視原始碼案例)。

case class Book(title: String, pages: Int) 
  val books = Seq( Book("Future of Scala developers", 85), 
                  Book("Parallel algorithms", 240), 
                  Book("Object Oriented Programming", 130), 
                  Book("Mobile Development", 495) ) 
  //Book(Mobile Development,495) 
  books.maxBy(book => book.pages) 
  //Book(Future of Scala developers,85) 
  books.minBy(book => book.pages)

如上所示,minBy & maxBy 方法解決了複雜資料的問題。你只需選擇決定資料最大或最小的屬性。

#2 過濾

你過濾過集合嗎?比如,篩選價格大於10美元的條目,或挑選年齡在24歲以下員工等,所有這些操作屬於過濾。

讓我們舉例說明:過濾一個數字 List,只獲取奇數的元素。

val numbers = Seq(1,2,3,4,5,6,7,8,9,10) numbers.filter(n => n % 2 == 0)

然後加大難度,我想獲取頁數大於120頁的書。

val books = Seq( Book("Future of Scala developers", 85), 
                 Book("Parallel algorithms", 240), 
                 Book("Object Oriented Programming", 130), 
                 Book("Mobile Development", 495) ) 
   books.filter(book => book.pages >= 120)

實際上,過濾是一個轉換型別的方法,但是比運用 min 和 max 方法簡單。

還有一個與 filter 類似的方法是 filterNot。它的名字就體現了它的作用。如果你還是不瞭解它的實際用途,你可以在一個示例中,用 filterNot 替換 filter 方法。

#3 Flatten O_o

我想大多數朋友都沒聽說過這個功能。其實它很好理解,我們來舉例說明:

val abcd = Seq('a', 'b', 'c', 'd') 
   val efgj = Seq('e', 'f', 'g', 'h') 
   val ijkl = Seq('i', 'j', 'k', 'l') 
   val mnop = Seq('m', 'n', 'o', 'p') 
   val qrst = Seq('q', 'r', 's', 't') 
   val uvwx = Seq('u', 'v', 'w', 'x') 
   val yz = Seq('y', 'z') 
   val alphabet = Seq(abcd, efgj, ijkl, mnop, qrst, uvwx, yz) 
   // 
  // List(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t,
  //      u, v, w, x, y, z) 
   alphabet.flatten

當有一個集合的集合,然後你想對這些集合的所有元素進行操作時,就會用到 flatten。

#4 Euler Diagram 函式

[譯者注:Euler Diagram 可以翻譯為尤拉圖,但請注意與 Euler Graph 的區別。Euler Diagram 用於描述集合及集合間的關係,而 Euler Graph 描述的是一種“圖”這樣的資料結構]

不要緊張!接下來的操作大家都熟知:差集、交集和並集。以下示例能很好地解釋 Euler Diagram 函式:

val num1 = Seq(1, 2, 3, 4, 5, 6) 
   val num2 = Seq(4, 5, 6, 7, 8, 9) 
   //List(1, 2, 3) 
   num1.diff(num2) 
   //List(4, 5, 6) 
   num1.intersect(num2) 
   //List(1, 2, 3, 4, 5, 6, 4, 5, 6, 7, 8, 9) 
   num1.union(num2)

上述示例中的 union 保留了重複的元素。如果我們不需要重複怎麼辦?這時可以使用 distinct 函式:

//List(1, 2, 3, 4, 5, 6, 7, 8, 9) 
num1.union(num2).distinct

下面是上述功能的圖示:


#5 map(對映)列表元素

map 是 Scala 集合最常用的一個函式。它的功能十分強大:

val numbers = Seq(1,2,3,4,5,6) 
   //List(2, 4, 6, 8, 10, 12) 
   numbers.map(n => n * 2) 
   val chars = Seq('a', 'b', 'c', 'd') 
   //List(A, B, C, D) 
   chars.map(ch => ch.toUpper)

map 函式的邏輯是遍歷集合中的元素並對每個元素呼叫函式。你也可以不呼叫任何函式,保持返回元素本身,但這樣 map 無法發揮作用,因為你在對映過後得到的是同樣的集合。

#6 flatMap

我很難具體說明 flatMap 的使用場合,因為很多不同的情況下都會用到 flatMap。如果大家仔細觀察,就會發現 flatMap 是由下列這兩個函式組成的:

map & flatten

現在,假設我們想知道字母表中的大寫字母和小寫字母的排列情況:

val abcd = Seq('a', 'b', 'c', 'd') 
  //List(A, a, B, b, C, c, D, d) 
  abcd.flatMap(ch => List(ch.toUpper, ch))

因為這篇文章是關於集合功能的介紹,所以此處略過 Future 和 Option 的示例。

#7 對整個集合進行條件檢查

有一個場景大家都知道,即確保集合中所有元素都要符合某些要求,如果有哪怕一個元素不符合條件,就需要進行一些處理:

val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2) 
  //ture numbers.forall(n => n < 10) 
  //false numbers.forall(n => n > 5)

而 forall 函式就是為處理這類需求而建立的。

#8 對集合進行分組

你是否嘗試過將一個集合按一定的規則拆分成兩個新的集合?比如,我們把某個集合拆分成偶數集和奇數集,partition 函式可以幫我們做到這一點:

val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2) 
   //(List(2, 6, 4, 2), List(3, 7, 9, 5, 1)) 
   numbers.partition(n => n % 2 == 0)

#9 Fold?

另一個流行的操作是 fold。 在 Scala 的上下文中,通常可以考慮 foldLeft 和 foldRight。他們是從不同的方面做同樣的工作: 

val numbers = Seq(1, 2, 3, 4, 5) 
//15 numbers.foldLeft(0)((res, n) => res + n)

在第一對括號中,我們放一個起始值。 在第二對括號中,我們定義需要對數字序列的每個元素執行的操作。 第一步,n = 0,然後它根據序列元素變化。

另一個關於 foldLeft 的例子,計算字元數:

val words = Seq("apple", "dog", "table") 
   //13 words.foldLeft(0)((resultLength, word) => resultLength + word.length)