Spark程式進行單元測試-使用scala

阿新 • • 發佈：2018-12-25

Spark 中進行一些單元測試技巧：

最近剛寫了一點Spark上的單元測試，大概整理了一些

rdd測試

spark程式一般從叢集中讀取資料然後通過rdd進行轉換，這其中涉及到叢集，每次修改bug，上傳到叢集再執行測試，代價還是挺大;所以儘可能先本地進行單元測試，以減少在叢集上執行時錯誤,特別是map等各種tranforms動作的邏輯錯誤；以下示例用於測試本地返回rdd相關的方法(利用spark本地模式進行單元測試)
Tips：
這裡寫圖片描述

//定義一個簡單的wordcount
object WordCount extends Serializable{ 
  def count(lines:RDD[String]): RDD[(String,Int)]={
    val 
 rdd=lines.flatMap(line=>line.split("\\s")).map(word=>(word,1)).reduceByKey(_ + _)
    rdd
  }
}

//引入scalatest建立一個單元測試類，混入特質BeforeAndAfter，在before和after中分別初始化sc和停止sc，
//初始化SparkContext時只需將Master設定為local(local[N],N表示執行緒)即可，無需本地配置或搭建叢集，

class WordCountTests extends FlatSpec with BeforeAndAfter{
  val 
 master="local" //sparkcontext的執行master 
  var sc:SparkContext=_
  it should("test success") in{
   //其中引數為rdd或者dataframe可以通過通過簡單的手動構造即可
    val seq=Seq("the test test1","the test","the")
    val rdd=sc.parallelize(seq)
    val wordCounts=WordCount.count(rdd)
    wordCounts.map(p=>{
       p._1 match 
 {
         case "the"=>
           assert(p._2==3)
         case "test"=>
           assert(p._2==2)
         case "test1"=>
           assert(p._2==1)
         case _=>
           None
       }
    }).foreach(_=>())
  }
  //這裡before和after中分別進行sparkcontext的初始化和結束，如果是SQLContext也可以在這裡面初始化
  before{
    val conf=new SparkConf()
      .setAppName("test").setMaster(master)
    sc=new SparkContext(conf)
  }

  after{
    if(sc!=null){
      sc.stop()
    }
  }
}

無返回值方法測試

有時候一個方法起到一個呼叫流程的作用，最後可能是輸出或者寫入某個檔案而沒有返回值，一般單元測試可能是檢視最後有沒有輸出檔案，但是ide在本地可能不太好進行測試
例如：

trait WriterHandle{
   def writer(records:Seq[GenericRecord]):Unit={
     val parquetWriter=...
     records.foreach(parquetWriter.writer(..)) 
   }
}
//一個類處混入這個特質,經過一定轉換後將結果資料寫入parquet中
class ProcessHandle(objects:Iterator[T]) extends Serializable with WriterHandle{
  def process():Unit={
     val records:Seq[GenericRecord]=build(objects)={
        ...
     }
     //這裡呼叫了特質writer中的writer方法，實際單元測試執行到這裡可能寫入的時候會出錯，不能正常測試通過
     writer(records)
  }
}

class Writertests extends FlatSpec {
  it should("write success") in{
    val objects=Seq(object1,object2..).toIterator 
    //在new處理類，混入原先特質的一個子特質
    val process=new ProcessHandle(objects) with Writerhandletest 
  }
} 
//可以自定義一個trait繼承自原先的特質，通過將原先的方法覆蓋，然後在重寫後的方法裡面的根據傳入值定義所需要斷言即可
trait Writerhandletest extends WriterHandle{
  override def writer(records:Seq[GenericRecord]):Unit={
     assert(records.length==N)
     assert(records(0).XX=="xxx")
   }
}

如有必要也可以測試下私有方法:

理論上來說，私有方法都會被公有方法呼叫，呼叫公有方法也可以驗證私有方法，不過如果公有方法不方便測試也可以對某個私有方法進行測試，就看是否有必要
可以測試如下：


class  MyTest(s:String){
  //此公有方法可能不方便測試
  def ():Unit={
     ...
     doSth(s)
  }
  //這裡私有方法，可能是邏輯關鍵所在，有必要測試
  private def doSth(s:String):String={
     ...
  }
}

編寫單元測試

//要混入PrivateMethodTester特質
class MytestTests extends FlatSpec with PrivateMethodTester{
  it should("write success") in{

        //首先new一個要測試的類
    val myTest=new MyTest("string") 
       //其中通過PrivateMethod修飾，[]中為返回值， ('method)單引號後跟私有方法名 
    val dosth=PrivateMethod[String]('doSth)
       //通過invokePrivate 委託呼叫私有方法,注意引數要對，貌似傳null的話會找不到對應的方法
    val str=myTest invokePrivate dosth("string")
       //最後斷言相應的至即可
    asset(str=="string") 
  }
}

Spark程式進行單元測試-使用scala

Spark 中進行一些單元測試技巧：最近剛寫了一點Spark上的單元測試，大概整理了一些 rdd測試 spark程式一般從叢集中讀取資料然後通過rdd進行轉換，這其中涉及到叢集，每次修改bug，

使用xUnit為.net core程式進行單元測試(3)

測試的分組開啟Game.Tests裡面的BossEnemyShould.cs, 為HaveCorrectPower方法新增一個Trait屬性標籤: [Fact] [Trait("Category", "Enemy")] public v

使用xUnit為.net core程式進行單元測試(4)

資料驅動的測試開啟PlayerCharacterShould.cs 新增幾個Fact測試方法: [Fact] public void TakeZeroDamage() { _sut.TakeDamage(

使用xUnit為.net core程式進行單元測試 -- Assert

Assert Assert做什麼？Assert基於程式碼的返回值、物件的最終狀態、事件是否發生等情況來評估測試的結果。Assert的結果可能是Pass或者Fail。如果所有的asserts都pass了，那麼整個測試就pass了；如果有任何assert fail了，那麼測試就fail了。 xUnit提供

使用xUnit為.net core程式進行單元測試(1)

導讀為什麼要編寫自動化測試程式（Automated Tests）？可以頻繁的進行測試可以在任何時間進行測試，也可以按計劃定時進行，例如：可以在半夜進行自動測試。肯定比人工測試要快。可以更快速的發現錯誤。基本上是非常可靠的。測試程式碼與生產程式碼緊密結合。使得開發團隊更具有幸

NUnit.Framework在VS2015中如何進行單元測試

開放 ron 微軟 strong 擴展分享方案 mar 項目微軟在VS2015中加入了自動化生成測試功能，在需要測試的源文件的公共方法中右鍵既可以創建單元測試。不過需要註意的是，要在公共方法中創建，否則會提示這個錯誤如下是自動化單元測試界面，可以發

在vue-cli生成的項目中使用karma+chrome進行單元測試

使用設計實現測試用例 runner 服務進行 ui界面包含 node 用vue-cli生成項目時，如果選擇了單元測試，那麽會采用karma+mocha作為單元測試框架，默認使用的瀏覽器是PhantomJs。 Karma是一個基於Node.js的JavaScri

springMVC整合Junit4進行單元測試

Glib 對 C 函數進行單元測試

error ati 完成 structure 是否 pac str txt b- 1. Glib 單元測試框架 Glib 為單元測試提供了一套完整的測試框架，每個測試運行包括以下幾個部分測試數據結構測試 setup 與 teardown 函數測試函數 2. 單元測

【轉載】IntelliJ IDEA配置JUnit進行單元測試

dbd ima pom.xml format height eight nsh 格式 oot 前提條件安裝JDK，並配置好環境變量工程已解決JUnit依賴關系（pom.xml） IDEA中JUnit配置 IDEA自帶一個JUnit插件，打開Settings窗口搜

Spring整合Junit4進行單元測試

CA spa dep pat unit ati 測試 ID sco 一. 添加依賴包（maven） <dependency> 　　<groupId>junit</groupId> 　　<artifactId>junit<

IDEA 自動生成Junit進行單元測試

沒有 src ner acc 路徑 name cep csdn ctr 1，從插件資源庫中搜索JunitGenerator V2.0版本，通過此工具自動完成test類的生成。Settings > Plugins 2，配置生成test類的路徑。Settings &

PHPstorm配置PHPunit對composer引入的php代碼進行單元測試

擴展方法 alt 安裝 load date 分享圖片 trap use str 1、如何安裝PHPunit，這裏不展述（如需打斷點debug測試，安裝PHP的xdebug擴展方法也不展開說了 https://xdebug.org/） 2、如何進行配置以 PHP設計

Android Studio中進行單元測試

term pack jsb java 測試的 dep create stat multi 在Android開發過程中，我們往往忽略了單元測試功能，主要還能還是大家覺得真機在手，運行調試特別直觀。不過如果我們能夠養成單元測試的習慣，相信能更加提升我們應用開發的速度。

Spring Boot 項目在 IDEA 中進行單元測試

res sin run ng- targe clas 單元測試 2.0 就會 Spring Boot提供了許多實用程序和註釋來幫助您測試應用程序。測試由兩個模塊提供支持：spring-boot-test包含核心項，spring-boot-test-autoconfigur

Sping MVC 整合Junit4進行單元測試及常見錯誤解決

bat 手工 jar包測試 ava spin .get sco 多個 1.Sping整合Junit4進行單元測試：使用spring-test和Junit4進行單元測試（1）maven依賴：添加spring-test和Junit4 jar包對於jdk1.7版本，sprin

如何開始用Junit進行單元測試

nbsp gif isp public aik 分享 pan 因此可操作性近段時間，公司預備推動單元測試以提高轉測代碼的質量，借鑒學習一些測試大佬的經驗自己試了一把，小測我在此寫下初寫單元測試的心得，希望能和大家交流交流單元測試技術！一、概述 1、單元測試（

用flask開發個人部落格（28）—— 利用unittest進行單元測試

下面分析下這個webapp的單元測試模組test，請先看下目前test下的檔案結構：目前__init__.py檔案還是空，請檢視test_basic.py的程式碼： import unittest from flask impor

如何對第一個Vue.js元件進行單元測試（上）

　　首先，為什麼要單元測試元件？　　單元測試是持續整合的關鍵。通過專注於小的、獨立的實體，確保單元測試始終按預期執行，使程式碼更加可靠，你可以放心地迭代你的專案而不必擔壞事兒。　　單元測試不僅限於指令碼。可以獨立測試的任何東西都是可單元測試的，只要你遵循一些好的做法。這些例項包括單一責任、可預測性和鬆

如何對第一個Vue.js元件進行單元測試（下）

我們的首次測試讓我們來寫首個測試。我們首先需要使用shallowMount手動掛載我們的元件，並將其儲存在我們將執行斷言的變數中。我們還可以通過propsData屬性傳遞道具作為物件。已安裝的元件是一個物件，它有一些實用方法：然後，我們可以寫第一個斷言：讓我們來

Spark程式進行單元測試-使用scala

Spark 中進行一些單元測試技巧：

rdd測試

無返回值方法測試

如有必要也可以測試下私有方法:

相關推薦