使用 Hibench 對 Spark 進行基準測試

阿新 • • 發佈：2018-12-13

文章目錄

概述
環境準備

安裝
配置

執行

配置
檢視報告

概述

Hibench 是 Intel 開源的大資料基準測試工具，可以評估不同大資料框架的速度，吞吐量和系統資源利用率。包括 Sort, WordCount, TeraSort, Sleep, SQL, PageRank, Nutch indexing, Bayes, Kmeans, NWeight 和 enhanced DFSIO等，還支援流任務的基準測試，例如 Spark Streaming, Flink, Storm 和 Gearpump。

環境準備

安裝

//獲取原始碼
wget https://github.com/intel-hadoop/HiBench/archive/HiBench-7.0.zip
//編譯spark相關模組
 mvn -Phadoopbench -Psparkbench -Dspark=2.2 -Dscala=2.11 clean package
// 安裝 bc 用於生成 report 資訊
yum install bc

配置

conf/spark.conf
根據檔案提示配置相關的路徑和引數即可

conf/hadoop.conf

# Hadoop home
hibench.hadoop.home     /opt/cloudera/parcels/CDH/lib/hadoop

# The path of hadoop executable
hibench.hadoop.executable     /opt/cloudera/parcels/CDH/bin/hadoop

# Hadoop configraution directory
hibench.hadoop.configure.dir  /etc/hadoop/conf

# hdfs namenode 地址或者 nameservice
hibench.hdfs.master       hdfs://localhost:8020

# Hadoop release provider. Supported value: apache, cdh5, hdp
hibench.hadoop.release    cdh5

conf/hibench.conf

# 生成測試資料的規模，預設有 tiny, small, large, huge, gigantic and bigdata，具體可以在對應benchmark的conf裡修改
hibench.scale.profile                tiny

# Mapper number in hadoop, partition number in Spark
hibench.default.map.parallelism         8

# Reducer nubmer in hadoop, shuffle partition number in Spark
hibench.default.shuffle.parallelism     8

執行

進行terasort 測試

配置

可以自定義資料規模
conf/workloads/micro/terasort.conf

#datagen
hibench.terasort.tiny.datasize			32000
hibench.terasort.small.datasize			3200000
hibench.terasort.large.datasize			32000000
hibench.terasort.huge.datasize			320000000
hibench.terasort.gigantic.datasize		3200000000
hibench.terasort.bigdata.datasize		6000000000
# 增加自定義的資料量
hibench.terasort.myscale.datasize 5242880

hibench.workload.datasize		${hibench.terasort.${hibench.scale.profile}.datasize}

# export for shell script
hibench.workload.input			${hibench.hdfs.data.dir}/Terasort/Input
hibench.workload.output			${hibench.hdfs.data.dir}/Terasort/Output%

在 hibench.conf 中設定 hibench.scale.profile 為 myscale。

bin/workloads/micro/terasort/prepare/prepare.sh
bin/workloads/micro/terasort/spark/run.sh

檢視報告

report/hibench.report
在這裡插入圖片描述

使用 Hibench 對 Spark 進行基準測試

文章目錄概述環境準備安裝配置執行配置檢視報告概述專案地址: Intel-hadoop/HiBench Hibench 是 Intel 開源的大資料

用sysbench對linux進行基準測試

sysbench提供了針對linux的基準測試能力，它支援測試CPU、記憶體、檔案IO、訊號量、執行緒等的能力，甚至包括mysql的基準測試。 1. 基本指令 sysbench [common-

【MySQL】【壓測】使用sysbench對MySQL進行壓力測試

usr with sleep library val repos then plot 停止 1.背景 ? 出自percona公司，是一款多線程系統壓測工具，可以根據影響數據庫服務器性能的各種因素來評估系統的性能。例如，可以用來測試文件IO，操作系統調度器，內存分配和傳輸

使用ab對網站進行壓力測試

進行壓力測試 oca tools ray local too install 1、安裝yum install httpd-tools 2、ab -kc 1000 -n 1000 http://localhost/ab.html 這個指令會使用1000個並發，進行連接

.net core 使用ConcurrentTest元件對方法進行壓力測試

工欲善其事，必先利其器！在編寫服務中首先要有一個好的測試工具，在dontecore下效能測試有BenchmarkDotNet，只需要簡單的配置一下就可以對方法的效能進行詳細的測試。但有時候需要對不同併發下看其處理效率和延時統計檢視，如HTTP服務對應著大量的測試工具如ab,bombardier等等。由於找不到

使用Jmeter工具對tomcat進行壓力測試（7）

本文主要使用jmeter工具對tomcat8進行壓力測試，並使用java visualVM進行壓測效能監控，通過監控資料調整tomcat引數步入正題：首先作業系統已優化完成，java版本為1.8以上,tomcat版本8.0.48,根據自己實際情況而定使用tomcat預設引數進行壓測 #vi

Java執行緒與執行緒安全，開啟多執行緒及每執行緒迴圈10次對類進行輸出測試

最近看到執行緒問題，emmm~腦闊回想到計算機作業系統貌似又講，不過上課睡覺覺去啦哈哈哈，java課老師莫得講~ 然歸正傳，今對執行緒進行查閱及測試，做一下筆記，有錯之處還請指出，謝謝~上程式碼之前呢先說一哈前傳執行緒是程序中的最小執行單位：手機呢會有很多單獨

使用 aspectj 對 spark 進行攔截

文章目錄背景如何使用程式碼配置結語背景開源產品要想用的得心應手免不了要根據公司的業務/場景對其做一些改造，如果直接在原始碼的層面對其修改，當下可能用的很省心，但後期與社群程式碼的

linux下使用ab工具對伺服器進行壓力測試

ab 安裝 yum -y install httpd-tools （centos) 安裝完成後使用ab -v 檢視ab版本確認是否安裝成功選項選項含義 -A auth-username:password 對伺服器提供BASIC認證信任。使

使用Monkey對APP進行壓力測試

最近在對新開發的APP進行壓力測試，學習了Monkey。在這裡進行一下總結和記錄。 monkey是手機系統自帶的一個軟體，它存在於adb shell中，對使用者是不可見的，但是可以通過ADB（Android Debug Bridge）進入手機系統裡面，它主要是生成使用者

使用JMeter對Tomcat進行壓力測試與Tomcat效能調優

一、準備工作。 1、安裝JDK1.6或1.6版本以後的，並配置環境變數。 2、在Apache的官網下載最新的Jmeter， http://jmeter.apache.org/download_jmeter.cgi，截止目前為止，最新的Jmeter是

搭建jmeter測試環境，定義效能測試流程，對web進行效能測試，並上傳效能測試結果截圖

下載jmeter 官網地址：http://mirror.bit.edu.cn/apache//jmeter/ 啟動雙擊上面批處理檔案。出現下圖 1 新增執行緒組 2 新增測試httpRequest 3 新增測試結果view 4 測試 5 檢視聚合報告報告引數解釋 L

使用Selenium通過瀏覽器對網站進行自動化測試

　　說明：本文只是一個getStart示例，關鍵在於讓自己（新手）能快速地對Selenium自動化測試有個大概的認識，下面開始。 1.準備 eclipse、jdk、maven 新建好一個maven專案下載好FireFox、Chrome、IE，最好是預

用mysqlslap對MySQL進行壓力測試

MySQL5.1地的確提供了好多有力的工具來幫助我們DBA進行資料庫管理。現在看一下這個壓力測試工具mysqlslap.關於他的選項手冊上以及--help介紹的很詳細。我解釋一下一些常用的選項。這裡要注意的幾個選項：--concurrency代表併發數量，多個可以用逗號隔開

通過python呼叫adb命令對app進行效能測試（6 -1）

上篇文章中講述了adb是什麼，以及常用的命令，下面我們來看下通過adb來檢視手機裝置中的效能引數，首先要檢視apk的包名和預設Activity的名字有好幾種方式，下面介紹2種第一種 1 開啟cmd 切換目錄D:\tool\android-sdk_r24.

YCSB 對MongoDB 進行壓力測試

執行環境：CentOS7.5 +YCSB 0.16版本+MongoDB 3.6.6 注意：參考YCSB 0.15.0的版本釋出說明資訊， Tested in previous releases, unchanged in this release中MongoDB支援的版

知己知彼–對Aurora進行壓力測試

一、前言 Amazon Aurora 是一種為雲打造並與 MySQL 和 PostgreSQL 相容的關係資料庫，既具有高階商用資料庫的效能和可用性，又具有開源資料庫的簡單性和成本效益。相比起MYSQL, Aurora在只讀副本延遲，可擴充套件性，備份恢復速度以及儲存空間擴充

基於TSUNG對MQTT進行壓力測試-測試結果

yum install -y ncurses-devel openssl-devel unixODBC-devel wxWidgets-devel wxGTK3-docs mesa-libGL-devel

使用ApacheBench(ab)對URL進行壓力測試(HTTP直壓)

ApacheBench(ab)安裝 ubuntu 安裝 apt-get install apache2-utils // 可單獨安裝，與apache2無捆綁關係。若無法安裝，請更新源後重試。其它系統安裝，自行搜尋。 ApacheBench

基於TSUNG對MQTT進行壓力測試-基礎概念溫習

一、TCP報頭部中的SYN、FIN、ACK：ACK ： TCP協議規定，只有ACK=1時有效，也規定連線建立後所有傳送的報文的ACK必須為1。SYN(SYNchronization) ：在連線建立時用來同步序號。當SYN=1而ACK=0時，表明這是一個連線請求報文。對方若同意建立連線，則應在響應報文中使SY

使用 Hibench 對 Spark 進行基準測試

文章目錄

概述

環境準備

安裝

配置

執行

配置

檢視報告

相關推薦