Hadoop權威指南學習——從Hadoop URL讀取資料

阿新 • • 發佈：2019-01-06

一、準備工作

在hadoop-env.sh中配置好 HADOOP_CLASSPATH 變數，值為編譯後的.class檔案所放置的地方。

export HADOOP_CLASSPATH=/usr/software/hadoop/hadoop-2.2.0/classpath

二、編寫程式

import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
import org.apache.hadoop.io.IOUtils;

import java.io.IOException;
import java.io.InputStream;
import java.net.URL;

public class URLCat {

    static {
        URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
    }

    //讀取檔案輸出
    public static void main(String[] args) {
        InputStream in = null;
        try {

            in = new URL(args[0]).openStream();
            IOUtils.copyBytes(in, System.out, 4096, false);

        }catch (IOException e){
            e.printStackTrace();
        }finally {
            IOUtils.closeStream(in);
        }
    }
}

三、編譯執行

[[email protected] classpath]# javac URLCat.java
[[email protected] classpath]# hadoop URLCat hdfs://localhost/part-r-00000
1901	317
1949	111
1950	22

四、程式介紹

要從 Hadoop 檔案系統中讀取檔案，最簡單的方法是使用 java.net.URL 物件開啟資料流，從中讀取資料。

讓 Java 程式能夠識別 Hadoop 的 hdfs URL 方案還需要一些額外的工作。這裡採用的方法是 FsUrlStreamHandlerFactory 例項，呼叫 java.net.URL 物件的 setURLStreamHandlerFactory方法將其設定為 URL 物件所使用的URLStreamHandlerFactory

每個虛擬機器只能呼叫一次該方法，因此通常在靜態方法或程式碼塊中呼叫。這個限制意味著如果程式的其他第三方元件也宣告過一個 FsUrlStreamHandlerFactory 例項，該程式將無法使用。

結束

Hadoop權威指南學習——從Hadoop URL讀取資料

一、準備工作在hadoop-env.sh中配置好 HADOOP_CLASSPATH 變數，值為編譯後的.class檔案所放置的地方。 export HADOOP_CLASSPATH=/usr/software/hadoop/hadoop-2.2.0/cl

Hadoop權威指南學習筆記三

支持第三方 handle line src factory 模式多個重要 HDFS簡單介紹聲明：本文是本人基於Hadoop權威指南學習的一些個人理解和筆記，僅供學習參考。有什麽不到之處還望指出，一起學習一起進步。轉載請註明：http://blog.cs

Hadoop權威指南學習（三）——MapReduce應用開發

開發MapReduce程式，有一個特定流程：1.寫map和reduce函式，並經過單元測試；2. 編寫本地測試程式執行作業；3. 在叢集上執行，使用IsolationRunner在失敗的相同輸入資料上執行任務；4. 優化調整，任務剖析，Hadoop提供鉤子（hook）輔助分

ALchemy學習-從mysql資料庫讀取資料顯示到頁面

在python中，一般不會在資料庫裡寫SQL語句，而是通過ORM（物件關係對映）將python物件對映為資料庫裡的資料，實現對資料庫的操作。ALchemy是python裡功能強大的一款OMR包。我寫了一個簡單的程式是這樣的： 1. http://local

《Hadoop 權威指南 - 大資料的儲存與分析》學習筆記

第一章初識Hadoop 1.2 資料的儲存與分析對多個硬碟中的資料並行進行讀/寫資料，有以下兩個重要問題：硬體故障問題。解決方案：複製（replication）,系統儲存資料的副本（replica）。以某種方式結合大部分資料來共同完成分析。MapReduce

《Hadoop權威指南》學習筆記（四）

1 Yarn的MapReduce工作流程經典的MapReduce頂層包括5個獨立實體客戶端，提交MapReduce作業 YARN資源管理器，協調叢集上計算資源分配 YARN節點管理器，負責啟動和監視叢集中的container MapReduce應用程式

《Hadoop權威指南》學習筆記（三）

本博文是我學習《Hadoop權威指南》第5章的筆記，主要是裡面範例程式的實現，部分實現有修改 1 Mapper測試需要使用mrunit這個jar包，在pom.xml新增dependency的時候，要新增classifier屬性不然下載不了jar包，根據自己hadoop-core的版本來確定

Hadoop權威指南-大資料的儲存與分析第四版——學習筆記——第2章——1

MapReduce 適合處理半結構化的資料 MapReduce任務階段 Map階段+Reduce階段 Key-Value作為輸入輸出實現兩個函式：map(),reduce() Map階段輸入的Key：文字中的偏移量輸入的value：文字輸出的k-v給reduce處

《Hadoop權威指南大資料的儲存與分析第版修訂版升級版》pdf附網盤下載連結+（附一個菜鳥的java學習之路）

技術書閱讀方法論一.速讀一遍（最好在1~2天內完成）人的大腦記憶力有限，在一天內快速看完一本書會在大腦裡留下深刻印象，對於之後複習以及總結都會有特別好的作用。對於每一章的知識，先閱讀標題，弄懂大概講的是什麼主題，再去快速看一遍，不懂也沒有關係，但是一定要在不懂的

學習Hadoop權威指南之Hadoop執行MapReduce日誌檢視

修改map配置檔案 mapred-site.xml [[email protected] yar]# vim /opt/hadoop-2.8.3/etc/hadoop/mapred-site.xml <property> <name&

hadoop權威指南(第四版)要點翻譯(4)——Chapter 3. The HDFS(1-4)

memory concept strac asc 主機 metadata ould txt ssi Filesystems that manage the storage across a network of machines are called d

hadoop權威指南(第四版)要點翻譯(5)——Chapter 3. The HDFS(5)

val str 能夠 byte present ted streaming 三種創建 5) The Java Interface a) Reading D

思考Hadoop權威指南的一段話

Hadoop權威指南 Hadoop 《Hadoop權威指南》這本書的第一章開頭有這樣一句話： “在古時候，人們用牛來拉重物。當一頭牛拉不動一根原木時，人們從來沒有考慮過要想方設法培育出一種更強壯的牛。同理，我們也不該想方設法打造什麽超級計算機，而應該千方百計綜合利用更多計算

分享《Hadoop權威指南（第四版）》中文PDF+英文PDF+原始碼

下載：https://pan.baidu.com/s/1YrWpwl2xgsFlf6GBS2Ry8w更多資料：http://blog.51cto.com/3215120 《Hadoop權威指南（第四版）》中文PDF+英文PDF+原始碼《Hadoop權威指南(第四版)》中文PDF+英文PDF+原始碼《Ha

分享《Hadoop權威指南（第四版）》中文PDF+英文PDF+源代碼

baidu size 源代碼 color tps ges 分享圖片 http text 下載：https://pan.baidu.com/s/1YrWpwl2xgsFlf6GBS2Ry8w更多資料：http://blog.51cto.com/3215120 《Hadoop權

分享《Hadoop權威指南（第四版）》+PDF+原始碼+Tom White+王海華東劉喻呂粵海

分享《Hadoop權威指南（第四版）》中文PDF+英文PDF+原始碼下載：https://pan.baidu.com/s/1-p38GRoYpgDrGlq1MPayaA更多資料：http://blog.51cto.com/14087171 《Hadoop權威指南（第四版）》中文PDF，734頁，帶書籤目錄。

分享《Hadoop權威指南(第2版)》+PDF+周敏奇

ESS src ext size img tex 正版指南請您下載：https://pan.baidu.com/s/1dIjxnZXxflhb5Ql73HRHkw 更多資料學習：http://blog.51cto.com/14087171 版權說明：本人無版權,請您在

Hadoop權威指南---I／O操作

目錄 Hadoop的I／O操作 1、資料完整性資料在進過網路io傳輸或者磁碟io時有可能會損壞，因此一般通過計算校驗和來確定傳輸資料是否被損壞。校驗和checksum也有可能會損壞，但是因為其數量

Hadoop權威指南---HDFS簡介和java API操作

目錄 Hadoop分散式檔案系統 1、HDFS的設計 HDFS的特點超大檔案，目前已經有PB級資料的Hadoop叢集；流式資料訪問，一次寫入、多次讀取；

Hadoop權威指南---MapReduce的型別與格式

目錄 package org.apache.hadoop.mapreduce; import java.io.IOException; import org.apache.hadoop.c

Hadoop權威指南學習——從Hadoop URL讀取資料

一、準備工作

二、編寫程式

三、編譯執行

四、程式介紹

結束

相關推薦