大資料入門（四）hdfs的shell語法

阿新 • • 發佈：2018-12-20

1、測試hdfs檔案上傳和下載（HDFS shell） 1.0檢視幫助 hadoop fs -help <cmd> 1.1上傳 hadoop fs -put <linux上檔案> <hdfs上的路徑> hadoop fs -put jdk-7u71-linux-x64.tar.gz hdfs://192.168.21.115:9000/

1.2檢視檔案內容 hadoop fs -cat <hdfs上的路徑> 1.3檢視檔案列表 hadoop fs -ls / 1.4下載檔案 hadoop fs -get <hdfs上的路徑> <linux上檔案>

hadoop fs -get hdfs://192.168.21.115:9000/jdk-7u71-linux-x64.tar.gz 1.5新建檔案(一層一層的建) hadoop fs -mkdir /aa hadoop fs -mkdir /aa/bb

1.6刪除資料夾 hadoop fs -rm -r /aa/bb 1.7 統計檔案大小 hadoop fs -du -s -h hdfs://192.168.21.115:9000/

1.8、copy 檔案到指定虛擬機器目錄 scp 檔案 192.168.21.116:/home/admin

2、測試mapreduce 使用shell自帶的程式測試（app/hadoop-2.4.1/share/hadoop/mapreduce）

hadoop jar hadoop-mapreduce-examples-2.4.1.jar pi 5 5

新建txt檔案： vi test.txt，寫入hello word 新建input資料夾，將檔案放到input資料夾中 hadoop fs -mkdir /wordcount hadoop fs -mkdir /wordcount/input hadoop fs -put test.txt /wordcount/input 執行計算，test.txt 中的文字個數，輸入結果放到output資料夾中 hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /wordcount/input /wordcount/output 檢視檔案列表：hadoop fs -ls /wordcount/output 檢視輸入檔案：hadoop fs -cat /wordcount/output/part-r-00000

2.使用java介面操作HDFS 見eclipse工程下的demo

本機修改ip對映：C:\Windows\System32\drivers\etc下的host檔案，配置對映

3.hadoop通訊機制不同程序之間的方法進行呼叫

4.HDFS原始碼分析 FileSystem.get --> 通過反射例項化了一個DistributedFileSystem --> new DFSCilent()把他作為自己的成員變數在DFSClient構造方法裡面，呼叫了createNamenode，使用了RPC機制，得到了一個NameNode的代理物件，就可以和NameNode進行通訊了 FileSystem --> DistributedFileSystem --> DFSClient --> NameNode的代理

大資料入門（四）hdfs的shell語法

大資料入門（四）hdfs的shell語法

大資料入門（4）hdfs的shell語法

大資料入門（18）hbase的shell語法

大資料入門（3）配置hadoop

大資料入門（2）安裝linux的jdk

大資料入門（1）準備linux環境

大資料入門（8）hdfs的客戶端檔案操作

大資料入門（17）hbase叢集搭建

大資料入門（16）mysql5.6.26的rpm方式安裝

大資料入門（15）hive簡介和配置

大資料入門（14）hadoop+yarn+zookeeper叢集搭建

大資料入門（13）zookeeper的安裝配置

大資料入門（12）mr倒排索引.

大資料入門（11）mr自定義分組和切片劃分

大資料入門（10）序列化機制，mr流量求和

大資料入門（9）mapreduce計算wordcount的程式編寫

大資料入門（7）RPC客戶端和RPC服務端通訊

大資料入門（6）hdfs的客戶端java

大資料入門（5）配置ssh免密登陸

大資料入門（20）kafka安裝配置

大資料入門（四）hdfs的shell語法

相關推薦