1. 程式人生 > >Scala練習三陣列相關操作

Scala練習三陣列相關操作

陣列相關操作

摘要:

本篇主要學習如何在Scala中運算元組。JavaC++程式設計師通常會選用陣列近似的結構(比如陣列列表向量)來收集一組元素。在Scala中,我們的選擇更多,不過現在我們先假定不關心其他選擇,而只是想馬上開始用陣列。本篇的要點包括:

1. 若長度固定則使用Array,若長度可能有變化則使用ArrayBuffer

2. 提供初始值時不要使用new

3. 用()來訪問元素

4. 用for (elem<-arr)來遍歷元素

5. 用for (elem<-arr if…)…yield…來將原陣列轉型為新陣列

6. Scala陣列和java陣列可以互操作;用AnayBuffer,使用scalacollection.JavaConversions中的轉換函式

定長陣列

如果你需要一個長度不變的陣列,可以用Scala中的Array。例如:

val nums=new Array[Int] (10) //長度為10的整數陣列,所有元素初始化為0

val a=new Array [String] (10) //長度為10的字串陣列,所有元素初始化為null

val s= Array("Hello", "World") //長度為2的Array[String]型別是推斷出來的,已提供初始值就不需要new

S (0) ="Goodbye" //Array("Goodby ","World"),使用()而不是[]來訪問元素

在JVM中,Scala的Array以Java陣列方式實現。示例中的陣列在JVM中的型別為java.lang.String[]

。Int、Double或其他與Java中基本型別對應的陣列都是基本型別陣列。

舉例來說,Array(2,3,5,7,11)在JVM中就是一個int[]

變長陣列:緩衝

尾端操作緩衝陣列

對於那種長度按需要變化的陣列Java有ArrayList,C++有vector。Scala中的等效資料結構為ArrayBuffer

import scala.collection.mutable.ArrayBuffer

val b=ArrayBuffer[lnt]() // 或者new ArrayBuffer [int],一個空的陣列緩衝,準備存放整數

b+=1 // ArrayBuffer (1),用+=尾端新增元素

b+=(1,2,3,5) // ArrayBuffer(1,1,2,3,5

),在尾端新增多個元素,以括號包起來

b++= Array(8, 13, 21) // ArrayBuffer(1, 1, 2, 3, 5, 8,13, 21) //用++=操作符追加任何集合

b.trimEnd(5) // ArrayBuffer(1, 1, 2),移除最後5個元素

在陣列緩衝的尾端新增或移除元素是一個高效的操作

任意位置操作緩衝陣列

你也可以在任意位置插入或移除元素,但這樣的操作並不那麼高效。所有在那個位置之後的元素,都必須被平移。舉例如下:

b.insert (2,6) //ArrayBuffer(1, 1, 6, 2),在下標2之前插入

b.insert (2,7,8,9) // ArrayBuffer(1, 1,7,8,9, 6,2),你可以插入任意多的元素

b.remove(2) // ArrayBuffer(1,1,8,9,6,2)

b.remove (2,3) //ArrayBuffer(1,1, 2),第2個引數的含義是要移除多少個元素

有時你需要構建一個Array,但不知道最終需要裝多少元素。在這種情況下,先構建一個數組緩衝,然後呼叫:

b.toArray //Array(1, 1,2)

反過來,呼叫亂toBuffer可以將一個陣列a轉換成一個陣列緩衝

遍歷陣列和陣列緩衝

全遍歷

在Java和C++中,陣列陣列列表向量有一些語法上不同,Scala則更加統一。大多數時候,你可以用相同的程式碼處理這兩種資料結構。以下是for迴圈遍歷陣列或陣列緩衝的語法:

for (i <- 0 until a.length) //變數i的取值從0到a length -1

println(i+":"+a(i))

utiI是Richlnt類的方法,返回所有小於但不包括上限的數字。例如:

0 until 10 // Range(0,1,2,3,4,5,6,7,8, 9)

需要注意的是,0 until 10實際上是一個方法呼叫:0.until(10)

條件遍歷

如下結構:

for(I <- 區間)

會讓變數i遍歷該區間的所有值。拿本例來說,迴圈變數i先後取值0、1,等等,直到但不包含a.length。如果想要每兩個元素一跳,可以讓i這樣來進行遍歷:

0 until (a.length,2) //Range(0,2,4,…)

如果要從陣列的尾端開始,遍歷的寫法為:

(0 until a.length) .reverse //Range(...,2,1,0)

如果在迴圈體中不需要用到陣列下標,我們也可以直接訪問陣列元素,就像這樣:

for (elem <- a)

println (elem)

這和Java中的"增強版"for迴圈,或者C++中的"基於區間的"for迴圈很相似。變數elem先後被設為a(0),然後a(1),依此類推

陣列轉換

for中的推導式和守衛

在前面,你看到了如何像Java或C++那樣運算元組。不過在Scala中,你可以走得更遠。從一個數組或陣列緩衝出發,以某種方式對它進行轉換是很簡單的。這些轉換動作不會修改原始陣列,而是產生一個全新的陣列。像這樣使用for推導式

val a=Array(2, 3, 5, 7, 11)

val result=for (elem <- a) yield 2*elem //result是Array(4,6,10, 14, 22)

for(…)yield迴圈建立了一個型別與原始集合相同的新集合。如果你從陣列出發,那麼你得到的是另一個數組。如果你從陣列緩衝出發,那麼你在for(…)yield之後得到的也

是陣列緩衝

結果包含yield之後的表示式的值,每次迭代對應一個。通常,當你遍歷一個集合時,你只想處理那些滿足特定條件的元素。這個需求可以通過守衛for中的if來實現。在這裡我們對每個偶數元素翻倍,並丟掉奇數元素:

for (elem <- a if elem%==0) yield 2*elem

請留意結果是個新的集合,原始集合並沒有受到影響

一種等價方法

除上述之外,還有另一種做法是

a.filter (_%2==0).map(2*_)

甚至

a.filter { _%2 == 0 } map {2*_ }

某些有著函數語言程式設計經驗的程式設計師傾向於使用filtermap而不是守衛yield,這不過是一種風格罷了與for迴圈所做的事完全相同。你可以根據喜好任意選擇。

高效陣列操作

考慮如下示例:給定一個整數的陣列緩衝,我們想要移除除第一個負數之外的所有負數傳統的依次執行的解決方案會在遇到第一個負數時置一個標記,然後移除後續出現的負數元素

var first=true

var n=a.length

var i=0

while ( i<n ) {

if (a(i) >= 0)

i+=1

else{

if (first) {

first=false

i+=1

} else {

a.remove (i)

n-=1

}

}

}

但這個方案其實並不那麼好:從陣列緩衝中移除元素並不高效,把非負數值拷貝到前端要好得多。

首先收集需要保留的下標:

var first= true

val indexes=for (i <- 0 until a.length if first || a(i)>=0) yield {

if (a(i)<0)

first=false;

i

}

然後將元素移動到該去的位置,並截斷尾端:

for(j <- 0 until indexes.length)

a(j)= a(indexes(j))

a.trimEnd (a.length -indexes.length)

這裡的關鍵點是,拿到所有下標好過逐個處理

常用演算法

求和與排序

有一種說法,很大比例的業務運算不過是在求和與排序。還好Scala有內建的函式來處理這些任務

Array(1,7,2, 9).sum // 19,對ArrayBuffer同樣適用

要使用sum方法,元素型別必須是數值型別:要麼是整型,要麼是浮點數或者Biglnteger/BigDecimal。

同理,min和max輸出陣列或陣列緩衝中最小和最大的元素。

ArraryBuffer("Mary", "had","a","little", "lamb").max // "little"

sorted方法將陣列或陣列緩衝排序並返回經過排序的陣列或陣列緩衝,這個過程並不會修改原始版本:

val b=ArrayBuffer(1,7,2, 9)

val bSorted=b.sorted(_ < _) // b沒有被改變,bSorted是ArrayBuffer(1,2,7,9)

還可以提供一個比較函式,不過你需要用sortWith方法:

val bDescending=b.sorted(_ > _) // ArrayBuffer(9,7,2, 1)

可以直接對一個陣列排序,但不能對陣列緩衝排序

val a=Array(1,7,2,9)

scala.util. Sorting.quickSortIa(a) // a現在是Array(1,2,7,9)

關於num、max和quickSort方法,元素型別必須支援比較操作,這包括了數字、字串以及其他帶有Ordered特質的型別。

顯示陣列內容

最後,如果你想要顯示陣列陣列緩衝的內容,可以用mkString方法,它允許你指定元素之間的分隔符。該方法的另一個過載版本可以讓你指定字首字尾。例如:

a.mkString("and") // "1 and 2 and 7 and 9"

a.mkString("<" , "," , ">") // "<1,2,7,9>"

和toString相比:

a.toString // " [[email protected]",這裡被呼叫的是Java的毫無意義的toString方法

b.toString // "ArrayBuffer(l,7,2, 9)",toString方法報告了型別,便於除錯

解讀Scaladoc

陣列和陣列緩衝有許多有用的方法,我們可以通過瀏覽Scala文件來獲取這些資訊。對Array類的操作方法列在ArrayOps相關條目下。從技術上講,在陣列上應用這些操作之前,陣列都會被轉換成ArrayOps物件。

由於Scala的型別系統比java更豐富,在瀏覽Scala的文件時,你可能會遇到一些看上去很奇怪的語法。所幸,你並不需要理解型別系統的所有細節就可以完成很多有用

的工作。你可以把下表用做"解碼指環"。

多維陣列

和Java樣,多維陣列是通過陣列的陣列來實現的。舉例來說,Double的二維陣列型別為:

Array[Array[Double]]

要構造這樣一個數組,可以用ofDim方法

val matrix=Array.ofDim[Double](3,4) //三行,四列要訪問其中的元素,使用兩對圓括號:

matrix (row) (column) =42

你可以建立不規則的陣列每一行的長度各不相同

val triangle=new ArraylArray [Int] (10)

for (i <- 0 until triangle.length)

triangle(i)=new Array[lnt] (i+1)

與Java互操作

由於Scala陣列是用java陣列實現的,你可以在Java和Scala之間來回傳遞。如果你呼叫接受返回java.utiI.List的Java方法,則當然可以在Scala程式碼中使用Java的ArrayList但那樣做沒什麼意思。你完全可以引入scala.collection.JavaConversions裡的隱式轉換方法。這樣你就可以在程式碼中使用Scala緩衝,在呼叫Java方法時,這些物件會被自動包裝成Java列表

舉例來說,java.lang.ProcessBuilder類有一個以List<String>為引數的構造器。以下是在Scala中呼叫它的寫法:

import scala.collection.JavaConversions.bufferAsJavaList

import scala.collection.mutable.ArrayBuffer

val command = ArrayBuffer("ls", "-al", "/home/cay")

val pb = new ProcessBuilder(command) // Scala到Java的轉換

Scala緩衝被包裝成了一個實現了java.util.List介面的Java類的物件。反過來講,當Java方法返回java.util.List時,我們可以讓它自動轉換成一個Buffer

import scala.collection.JavaConversions.asScalaBuffer

import scala.collection.mutable.Buffer

val cmd: Buffer[String] = pb.command() // Java到Scala的轉換

需要注意的是,不能使用ArrayBuffer——包裝起來的物件僅能保證是個Buffer。如果Java方法返回一個包裝過的Scala緩衝,那麼隱式轉換會將原始的物件解包出來。拿本例來說,cmd == command。☆☆