1. 程式人生 > 實用技巧 >入門大資料---Scala_Array

入門大資料---Scala_Array

一、定長陣列

在 Scala 中,如果你需要一個長度不變的陣列,可以使用 Array。但需要注意以下兩點:

  • 在 Scala 中使用 (index) 而不是 [index] 來訪問陣列中的元素,因為訪問元素,對於 Scala 來說是方法呼叫,(index) 相當於執行了 .apply(index) 方法。
  • Scala 中的陣列與 Java 中的是等價的,Array[Int]() 在虛擬機器層面就等價於 Java 的 int[]
// 10 個整數的陣列,所有元素初始化為 0
scala> val nums=new Array[Int](10)
nums: Array[Int] = Array(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)

// 10 個元素的字串陣列,所有元素初始化為 null
scala> val strings=new Array[String](10)
strings: Array[String] = Array(null, null, null, null, null, null, null, null, null, null)

// 使用指定值初始化,此時不需要 new 關鍵字
scala> val a=Array("hello","scala")
a: Array[String] = Array(hello, scala)

// 使用 () 來訪問元素
scala> a(0)
res3: String = hello

二、變長陣列

在 scala 中通過 ArrayBuffer 實現變長陣列 (又稱緩衝陣列)。在構建 ArrayBuffer 時必須給出型別引數,但不必指定長度,因為 ArrayBuffer 會在需要的時候自動擴容和縮容。變長陣列的構建方式及常用操作如下:

import scala.collection.mutable.ArrayBuffer

object ScalaApp {
    
  // 相當於 Java 中的 main 方法
  def main(args: Array[String]): Unit = {
    // 1.宣告變長陣列 (緩衝陣列)
    val ab = new ArrayBuffer[Int]()
    // 2.在末端增加元素
    ab += 1
    // 3.在末端新增多個元素
    ab += (2, 3, 4)
    // 4.可以使用 ++=追加任何集合
    ab ++= Array(5, 6, 7)
    // 5.緩衝陣列可以直接列印檢視
    println(ab)
    // 6.移除最後三個元素
    ab.trimEnd(3)
    // 7.在第 1 個元素之後插入多個新元素
    ab.insert(1, 8, 9)
    // 8.從第 2 個元素開始,移除 3 個元素,不指定第二個引數的話,預設值為 1
    ab.remove(2, 3)
    // 9.緩衝陣列轉定長陣列
    val abToA = ab.toArray
    // 10. 定長陣列列印為其 hashcode 值
    println(abToA)
    // 11. 定長陣列轉緩衝陣列
    val aToAb = abToA.toBuffer
  }
}

需要注意的是:使用 += 在末尾插入元素是一個高效的操作,其時間複雜度是 O(1)。而使用 insert 隨機插入元素的時間複雜度是 O(n),因為在其插入位置之後的所有元素都要進行對應的後移,所以在 ArrayBuffer 中隨機插入元素是一個低效的操作。

三、陣列遍歷

object ScalaApp extends App {

  val a = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

  // 1.方式一 相當於 Java 中的增強 for 迴圈
  for (elem <- a) {
    print(elem)
  }

  // 2.方式二
  for (index <- 0 until a.length) {
    print(a(index))
  }

  // 3.方式三, 是第二種方式的簡寫
  for (index <- a.indices) {
    print(a(index))
  }

  // 4.反向遍歷
  for (index <- a.indices.reverse) {
    print(a(index))
  }

}

這裡我們沒有將程式碼寫在 main 方法中,而是繼承自 App.scala,這是 Scala 提供的一種簡寫方式,此時將程式碼寫在類中,等價於寫在 main 方法中,直接執行該類即可。

四、陣列轉換

陣列轉換是指由現有陣列產生新的陣列。假設當前擁有 a 陣列,想把 a 中的偶數元素乘以 10 後產生一個新的陣列,可以採用下面兩種方式來實現:

object ScalaApp extends App {

  val a = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

  // 1.方式一 yield 關鍵字
  val ints1 = for (elem <- a if elem % 2 == 0) yield 10 * elem
  for (elem <- ints1) {
    println(elem)
  }

  // 2.方式二 採用函數語言程式設計的方式,這和 Java 8 中的函數語言程式設計是類似的,這裡採用下劃線標表示其中的每個元素
  val ints2 = a.filter(_ % 2 == 0).map(_ * 10)
  for (elem <- ints1) {
    println(elem)
  }
}

五、多維陣列

和 Java 中一樣,多維陣列由單維陣列組成。

object ScalaApp extends App {

  val matrix = Array(Array(11, 12, 13, 14, 15, 16, 17, 18, 19, 20),
    Array(21, 22, 23, 24, 25, 26, 27, 28, 29, 30),
    Array(31, 32, 33, 34, 35, 36, 37, 38, 39, 40))


  for (elem <- matrix) {

    for (elem <- elem) {
      print(elem + "-")
    }
    println()
  }

}

列印輸出如下:
11-12-13-14-15-16-17-18-19-20-
21-22-23-24-25-26-27-28-29-30-
31-32-33-34-35-36-37-38-39-40-

六、與Java互操作

由於 Scala 的陣列是使用 Java 的陣列來實現的,所以兩者之間可以相互轉換。

import java.util

import scala.collection.mutable.ArrayBuffer
import scala.collection.{JavaConverters, mutable}

object ScalaApp extends App {

  val element = ArrayBuffer("hadoop", "spark", "storm")
  // Scala 轉 Java
  val javaList: util.List[String] = JavaConverters.bufferAsJavaList(element)
  // Java 轉 Scala
  val scalaBuffer: mutable.Buffer[String] = JavaConverters.asScalaBuffer(javaList)
  for (elem <- scalaBuffer) {
    println(elem)
  }
}

參考資料

  1. Martin Odersky . Scala 程式設計 (第 3 版)[M] . 電子工業出版社 . 2018-1-1
  2. 凱.S.霍斯特曼 . 快學 Scala(第 2 版)[M] . 電子工業出版社 . 2017-7

系列傳送門