Hadoop實踐（四）---Hadoop叢集測試（MR樣例）

阿新 • • 發佈：2019-01-02

Hadoop 自帶的測試程式在{Hadoop安裝目錄}/share/hadoop/mapreduce/hadoop-mapreduce-examples-{hadoop版本}.jar

1.terasort測試程式

使用teragen，生成測試資料
對生成的資料進行terasort
使用teravalidate對結果進行檢查

1.teragen：

hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-example-2.7.3.jar teragen <num rows> <output dir>

teragen生成的資料每一行的格式如下：<10 bytes key> <10 bytes rowid> <78 bytes filler>\r\n

key是一些隨機字元，每個字元的ASCII碼取值範圍為[32, 126]
rowid是一個整數，右對齊
filler由7組字元組成，每組有10個字元（最後一組8個），字元從’A’到’Z’依次取值

2.terasort：
對資料進行排序，並將結果輸出到HDFS的輸出路徑中

hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-example-2.7.3.jar terasort <input dir> <output dir>

3.teravalidate：
驗證terasort輸出的結果是否有序，如果檢查到有問題，將亂序的key輸出到HDFS的report路徑中

hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-example-2.7.3.jar teravalidate <output dir> <report dir>

在report檔案下檢視輸出檔案顯示checksum表示排序沒有問題，測試結束。

2.pi

hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-example-2.7.3.jar pi <nMaps> <nSamples>

nMaps表示執行的Map節點個數

nSamples表示每一個節點的資料量（MB）

還有很多例子下次在寫

Hadoop實踐（四）---Hadoop叢集測試（MR樣例）

Hadoop 自帶的測試程式在{Hadoop安裝目錄}/share/hadoop/mapreduce/hadoop-mapreduce-examples-{hadoop版本}.jar 1.tera

怎樣把報表放到網頁中顯示（Web頁面與報表簡單集成樣例）

nal 嵌入自己 rim 框架 ram art ner prim 1.問題描寫敘述如今用戶開發的系統基本上趨向於BS架構的瀏覽器/server模式。這些系統可能由不同的語言開發。如HTML、ASP、JSP、PHP等。因此須要將制作好的報表嵌入到這些頁面中。 Fine

Hadoop學習記錄（四、hadoop實現檔案操作）

1.從Hadoop URL讀取資料類似cat命令 public class URLCat { static{ URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory()); }

【Hadoop學習之四】HDFS HA搭建（QJM）

環境　　虛擬機器：VMware 10 　　Linux版本：CentOS-6.5-x86_64 　　客戶端：Xshell4　　FTP：Xftp4 　　jdk8 　　hadoop-3.1.1 由於NameNode對於整個HDFS叢集重要性，為避免NameNode單點故障，在叢集裡建立2個或以上NameNode（不

MongoDB DBA 實踐6-----MongoDB的分片叢集部署（win單機）

分片叢集部署圖如

Python程式設計從入門到實踐第四章作業參考答案（部分）

4-2 動物animals = ["dog","cat","panda","squirrel"] for a in animals: print(a.title()) for a in animals: print("A",a,"could be so cut

Metasploit Framework（8）後滲透測試（一）

文章的格式也許不是很好看，也沒有什麼合理的順序完全是想到什麼寫一些什麼，但各個方面都涵蓋到了能耐下心看的朋友歡迎一起學習，大牛和槓精們請繞道使用場景： Kali機器IP：192.168.163.132 WindowsXP機器IP：192.168.163.134

kafka學習小結（springboot2+kafka組成叢集模式3同步非同步模式）

接著上一篇補充官網上關於這一塊迷迷糊糊的看不懂，自己總結了下其中的差異：我們一般沒做特殊處理的就是同步模式，生產者傳送訊息，然後交給消費者，這裡面我們也可以對訊息的結果進行處理，防止訊息丟失 kafkademo中，修改REST介面如下：

windows下搭建appium+android測試環境（node.js樣例）

安裝 Appium Appium是開源的自動化測試框架，主要用於iOS，Android以及Windows apps等移動平臺的自動化測試。官網的介紹說是它實現一套適用於移動端的WebDriver協議，所以使用Appium時用的還是依賴於Selenium，和Web自動化測試的

硬體編解碼（四）Intel提供的QuickSync使用樣例（1）主函式

主函式主函式的執行過程： 1、獲取使用者的輸入引數 2、解析使用者的輸入引數 3、建立編碼器 4、編碼器初始化 5、執行編碼器，開始編碼 6、編碼結束，關閉編碼器主函式程式碼 #if defined(_WIN32) || defined(_WIN64) int _

架構設計：系統間通訊（26）——ActiveMQ叢集方案（下）

3、ActiveMQ熱備方案 ActiveMQ熱備方案，主要保證ActiveMQ的高可用性。這種方案並不像上節中我們主要討論的ActiveMQ高效能方案那樣，同時有多個節點都處於工作狀態，也就是說這種方案並不提高ActiveMQ叢集的效能；而是從叢集中的多

libsvm之（一）安裝與測試（matlab）

作為一個晚起步的小夥子，得以站在大牛們的肩膀上快速入門。為了以防自己忘記，同時讓其他人系統性的libsvm入門更加快速，這就開啟一個系列了。（這裡會參考一篇幫助很大的blog：http://blog.csdn.net/abcjennifer/article/detai

Android中不同方向嵌套滑動的解決方式（ListView為樣例）

!= anim button wpa ktr text boolean adapter repeat 前言：就像手機QQ的聊天消息列表。一個縱向滑動的ListView列舉全部消息，但每一條消息能夠橫向滑動。而默認情況下，僅僅能有一個地方消化處理觸摸事件，要麽Lis

Python——使用高德API獲取POI（以深圳南山醫療保健服務POI為例）

tel range cnblogs 類別 ice index arch 獲取網頁 pla 以下內容為原創，轉載請註明出處。 1 import xlwt #創建Excel，見代碼行8，9，11，25，28；CMD下：運行pip install xlwt進行安裝 2 im

計算程序運行的時間（以求得1-10000之間的素數為例）

spa pen span 計算 sub 父類 println style 運行 //抽象類public abstract class Template { abstract void code();//要麽就聲明為實體方法，提供方法；要麽就加上abstract關鍵

Java中23種設計模式（附代碼樣例）

體會如何解決熱插拔原型原型模式 strac println template sendmai 一、設計模式分類總體來說設計模式分為三大類：創建型模式，共五種：工廠方法模式、抽象工廠模式、單例模式、建造者模式、原型模式。結構型模式，共七種：適配器模式、裝飾器模式、代理

設計模式-builder模式（以微信訊息的路由處理為例）

今天要講一個簡單的模式–builder模式。你可能會覺得,builder模式有什麼好講的？本來我也這樣覺得，但當我有幸拜讀某位大神通過builder模式寫了一個開發工具包的初始化操作，嗯程式碼的樣子很叼這位大神是誰呢？就是這位仁兄啦，是碼雲上一個很火的微信開發工具包的貢獻者之一。

微信公眾號介面呼叫JS-SDK（vue專案，以掃一掃為例）

該方法需引入微信js-sdk ，先npm安裝 //在一個地方呼叫this.weixin()方法，比如說按鈕 //寫掃一掃方法 weixin() { var that = this; var url=''; var params =

SpringMVC自定義註解進行引數校驗（以校驗列舉值是否合法為例）

pom引入springMVC依賴，以springboot專案為例 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-

貪心區間相關（貪心策略+注意細節）一定一定要學會造樣例啊

1、區間選擇最少的點覆蓋寫那種找滿足條件的數的時候還是用while迴圈更加優雅一些啊，我寫的for跟狗屎一樣，主要還是一開始貪心的姿勢錯了 #include<iostream> #include<algorithm> #include<

Hadoop實踐（四）---Hadoop叢集測試（MR樣例）

1.terasort測試程式

2.pi

相關推薦