Scala練習三陣列相關操作
陣列相關操作 |
摘要:
本篇主要學習如何在Scala中運算元組。Java和C++程式設計師通常會選用陣列或近似的結構(比如陣列列表或向量)來收集一組元素。在Scala中,我們的選擇更多,不過現在我們先假定不關心其他選擇,而只是想馬上開始用陣列。本篇的要點包括:
1. 若長度固定則使用Array,若長度可能有變化則使用ArrayBuffer
2. 提供初始值時不要使用new
3. 用()來訪問元素
4. 用for (elem<-arr)來遍歷元素
5. 用for (elem<-arr if…)…yield…來將原陣列轉型為新陣列
6. Scala陣列和java陣列可以互操作;用AnayBuffer,使用scalacollection.JavaConversions中的轉換函式
定長陣列 |
如果你需要一個長度不變的陣列,可以用Scala中的Array。例如:
val nums=new Array[Int] (10) //長度為10的整數陣列,所有元素初始化為0
val a=new Array [String] (10) //長度為10的字串陣列,所有元素初始化為null
val s= Array("Hello", "World") //長度為2的Array[String]型別是推斷出來的,已提供初始值就不需要new
S (0) ="Goodbye" //Array("Goodby ","World"),使用()而不是[]來訪問元素
在JVM中,Scala的Array以Java陣列方式實現。示例中的陣列在JVM中的型別為java.lang.String[]
舉例來說,Array(2,3,5,7,11)在JVM中就是一個int[]。
變長陣列:緩衝 |
尾端操作緩衝陣列
對於那種長度按需要變化的陣列,Java有ArrayList,C++有vector。Scala中的等效資料結構為ArrayBuffer
import scala.collection.mutable.ArrayBuffer
val b=ArrayBuffer[lnt]() // 或者new ArrayBuffer [int],一個空的陣列緩衝,準備存放整數
b+=1 // ArrayBuffer (1),用+=在尾端新增元素
b+=(1,2,3,5) // ArrayBuffer(1,1,2,3,5
),在尾端新增多個元素,以括號包起來b++= Array(8, 13, 21) // ArrayBuffer(1, 1, 2, 3, 5, 8,13, 21) //用++=操作符追加任何集合
b.trimEnd(5) // ArrayBuffer(1, 1, 2),移除最後5個元素
在陣列緩衝的尾端新增或移除元素是一個高效的操作
任意位置操作緩衝陣列
你也可以在任意位置插入或移除元素,但這樣的操作並不那麼高效。所有在那個位置之後的元素,都必須被平移。舉例如下:
b.insert (2,6) //ArrayBuffer(1, 1, 6, 2),在下標2之前插入
b.insert (2,7,8,9) // ArrayBuffer(1, 1,7,8,9, 6,2),你可以插入任意多的元素
b.remove(2) // ArrayBuffer(1,1,8,9,6,2)
b.remove (2,3) //ArrayBuffer(1,1, 2),第2個引數的含義是要移除多少個元素
有時你需要構建一個Array,但不知道最終需要裝多少元素。在這種情況下,先構建一個數組緩衝,然後呼叫:
b.toArray //Array(1, 1,2)
反過來,呼叫亂toBuffer可以將一個陣列a轉換成一個陣列緩衝
遍歷陣列和陣列緩衝 |
全遍歷
在Java和C++中,陣列和陣列列表/向量有一些語法上不同,Scala則更加統一。大多數時候,你可以用相同的程式碼處理這兩種資料結構。以下是for迴圈遍歷陣列或陣列緩衝的語法:
for (i <- 0 until a.length) //變數i的取值從0到a length -1
println(i+":"+a(i))
utiI是Richlnt類的方法,返回所有小於但不包括上限的數字。例如:
0 until 10 // Range(0,1,2,3,4,5,6,7,8, 9)
需要注意的是,0 until 10實際上是一個方法呼叫:0.until(10)
條件遍歷
如下結構:
for(I <- 區間)
會讓變數i遍歷該區間的所有值。拿本例來說,迴圈變數i先後取值0、1,等等,直到但不包含a.length。如果想要每兩個元素一跳,可以讓i這樣來進行遍歷:
0 until (a.length,2) //Range(0,2,4,…)
如果要從陣列的尾端開始,遍歷的寫法為:
(0 until a.length) .reverse //Range(...,2,1,0)
如果在迴圈體中不需要用到陣列下標,我們也可以直接訪問陣列元素,就像這樣:
for (elem <- a)
println (elem)
這和Java中的"增強版"for迴圈,或者C++中的"基於區間的"for迴圈很相似。變數elem先後被設為a(0),然後a(1),依此類推
陣列轉換 |
for中的推導式和守衛
在前面,你看到了如何像Java或C++那樣運算元組。不過在Scala中,你可以走得更遠。從一個數組或陣列緩衝出發,以某種方式對它進行轉換是很簡單的。這些轉換動作不會修改原始陣列,而是產生一個全新的陣列。像這樣使用for推導式:
val a=Array(2, 3, 5, 7, 11)
val result=for (elem <- a) yield 2*elem //result是Array(4,6,10, 14, 22)
for(…)yield迴圈建立了一個型別與原始集合相同的新集合。如果你從陣列出發,那麼你得到的是另一個數組。如果你從陣列緩衝出發,那麼你在for(…)yield之後得到的也
是陣列緩衝
結果包含yield之後的表示式的值,每次迭代對應一個。通常,當你遍歷一個集合時,你只想處理那些滿足特定條件的元素。這個需求可以通過守衛:for中的if來實現。在這裡我們對每個偶數元素翻倍,並丟掉奇數元素:
for (elem <- a if elem%==0) yield 2*elem
請留意結果是個新的集合,原始集合並沒有受到影響
一種等價方法
除上述之外,還有另一種做法是
a.filter (_%2==0).map(2*_)
甚至
a.filter { _%2 == 0 } map {2*_ }
某些有著函數語言程式設計經驗的程式設計師傾向於使用filter和map而不是守衛和yield,這不過是一種風格罷了與for迴圈所做的事完全相同。你可以根據喜好任意選擇。
高效陣列操作
考慮如下示例:給定一個整數的陣列緩衝,我們想要移除除第一個負數之外的所有負數。傳統的依次執行的解決方案會在遇到第一個負數時置一個標記,然後移除後續出現的負數元素
var first=true
var n=a.length
var i=0
while ( i<n ) {
if (a(i) >= 0)
i+=1
else{
if (first) {
first=false
i+=1
} else {
a.remove (i)
n-=1
}
}
}
但這個方案其實並不那麼好:從陣列緩衝中移除元素並不高效,把非負數值拷貝到前端要好得多。
首先收集需要保留的下標:
var first= true
val indexes=for (i <- 0 until a.length if first || a(i)>=0) yield {
if (a(i)<0)
first=false;
i
}
然後將元素移動到該去的位置,並截斷尾端:
for(j <- 0 until indexes.length)
a(j)= a(indexes(j))
a.trimEnd (a.length -indexes.length)
這裡的關鍵點是,拿到所有下標好過逐個處理
常用演算法 |
求和與排序
有一種說法,很大比例的業務運算不過是在求和與排序。還好Scala有內建的函式來處理這些任務
Array(1,7,2, 9).sum // 19,對ArrayBuffer同樣適用
要使用sum方法,元素型別必須是數值型別:要麼是整型,要麼是浮點數或者Biglnteger/BigDecimal。
同理,min和max輸出陣列或陣列緩衝中最小和最大的元素。
ArraryBuffer("Mary", "had","a","little", "lamb").max // "little"
sorted方法將陣列或陣列緩衝排序並返回經過排序的陣列或陣列緩衝,這個過程並不會修改原始版本:
val b=ArrayBuffer(1,7,2, 9)
val bSorted=b.sorted(_ < _) // b沒有被改變,bSorted是ArrayBuffer(1,2,7,9)
還可以提供一個比較函式,不過你需要用sortWith方法:
val bDescending=b.sorted(_ > _) // ArrayBuffer(9,7,2, 1)
可以直接對一個陣列排序,但不能對陣列緩衝排序:
val a=Array(1,7,2,9)
scala.util. Sorting.quickSortIa(a) // a現在是Array(1,2,7,9)
關於num、max和quickSort方法,元素型別必須支援比較操作,這包括了數字、字串以及其他帶有Ordered特質的型別。
顯示陣列內容
最後,如果你想要顯示陣列或陣列緩衝的內容,可以用mkString方法,它允許你指定元素之間的分隔符。該方法的另一個過載版本可以讓你指定字首和字尾。例如:
a.mkString("and") // "1 and 2 and 7 and 9"
a.mkString("<" , "," , ">") // "<1,2,7,9>"
和toString相比:
a.toString // " [[email protected]",這裡被呼叫的是Java的毫無意義的toString方法
b.toString // "ArrayBuffer(l,7,2, 9)",toString方法報告了型別,便於除錯
解讀Scaladoc |
陣列和陣列緩衝有許多有用的方法,我們可以通過瀏覽Scala文件來獲取這些資訊。對Array類的操作方法列在ArrayOps相關條目下。從技術上講,在陣列上應用這些操作之前,陣列都會被轉換成ArrayOps物件。
由於Scala的型別系統比java更豐富,在瀏覽Scala的文件時,你可能會遇到一些看上去很奇怪的語法。所幸,你並不需要理解型別系統的所有細節就可以完成很多有用
的工作。你可以把下表用做"解碼指環"。
多維陣列 |
和Java一樣,多維陣列是通過陣列的陣列來實現的。舉例來說,Double的二維陣列型別為:
Array[Array[Double]]
要構造這樣一個數組,可以用ofDim方法:
val matrix=Array.ofDim[Double](3,4) //三行,四列要訪問其中的元素,使用兩對圓括號:
matrix (row) (column) =42
你可以建立不規則的陣列,每一行的長度各不相同:
val triangle=new ArraylArray [Int] (10)
for (i <- 0 until triangle.length)
triangle(i)=new Array[lnt] (i+1)
與Java互操作 |
由於Scala陣列是用java陣列實現的,你可以在Java和Scala之間來回傳遞。如果你呼叫接受或返回java.utiI.List的Java方法,則當然可以在Scala程式碼中使用Java的ArrayList但那樣做沒什麼意思。你完全可以引入scala.collection.JavaConversions裡的隱式轉換方法。這樣你就可以在程式碼中使用Scala緩衝,在呼叫Java方法時,這些物件會被自動包裝成Java列表。
舉例來說,java.lang.ProcessBuilder類有一個以List<String>為引數的構造器。以下是在Scala中呼叫它的寫法:
import scala.collection.JavaConversions.bufferAsJavaList
import scala.collection.mutable.ArrayBuffer
val command = ArrayBuffer("ls", "-al", "/home/cay")
val pb = new ProcessBuilder(command) // Scala到Java的轉換
Scala緩衝被包裝成了一個實現了java.util.List介面的Java類的物件。反過來講,當Java方法返回java.util.List時,我們可以讓它自動轉換成一個Buffer:
import scala.collection.JavaConversions.asScalaBuffer
import scala.collection.mutable.Buffer
val cmd: Buffer[String] = pb.command() // Java到Scala的轉換
需要注意的是,不能使用ArrayBuffer——包裝起來的物件僅能保證是個Buffer。如果Java方法返回一個包裝過的Scala緩衝,那麼隱式轉換會將原始的物件解包出來。拿本例來說,cmd == command。☆☆