1. 程式人生 > 其它 >Hadoop Shell命令

Hadoop Shell命令

FS Shell

呼叫檔案系統(FS)Shell命令應使用bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路徑作為引數。URI格式是scheme://authority/path。對HDFS檔案系統,scheme是hdfs,對本地檔案系統,scheme是file。其中scheme和authority引數都是可選的,如果未加指定,就會使用配置中指定的預設scheme。一個HDFS檔案或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更簡單的/parent/child(假設你配置檔案中的預設值是namenode:namenodeport

)。大多數FS Shell命令的行為和對應的Unix Shell命令類似,不同之處會在下面介紹各命令使用詳情時指出。出錯資訊會輸出到stderr,其他資訊輸出到stdout

基本語法 bin/hdfs dfs 具體命令

引數大全 [[email protected] hadoop-2.6.0-cdh5.14.0]# bin/hdfs dfs

Usage: hadoop fs [generic options]
[-appendToFile <localsrc> ... <dst>]
[-cat [-ignoreCrc] <src> ...]
[-checksum <src> ...]
[-chgrp [-R] GROUP PATH...]
[-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
[-chown [-R] [OWNER][:[GROUP]] PATH...]
[-copyFromLocal [-f] [-p] [-l] <localsrc> ... <dst>]
[-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
[-count [-q] [-h] [-v] [-x] <path> ...]
[-cp [-f] [-p | -p[topax]] <src> ... <dst>]
[-createSnapshot <snapshotDir> [<snapshotName>]]
[-deleteSnapshot <snapshotDir> <snapshotName>]
[-df [-h] [<path> ...]]
[-du [-s] [-h] [-x] <path> ...]
[-expunge]
[-find <path> ... <expression> ...]
[-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
[-getfacl [-R] <path>]
[-getfattr [-R] {-n name | -d} [-e en] <path>]
[-getmerge [-nl] <src> <localdst>]
[-help [cmd ...]]
[-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [<path> ...]]
[-mkdir [-p] <path> ...]
[-moveFromLocal <localsrc> ... <dst>]
[-moveToLocal <src> <localdst>]
[-mv <src> ... <dst>]
[-put [-f] [-p] [-l] <localsrc> ... <dst>]
[-renameSnapshot <snapshotDir> <oldName> <newName>]
[-rm [-f] [-r|-R] [-skipTrash] <src> ...]
[-rmdir [--ignore-fail-on-non-empty] <dir> ...]
[-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
[-setfattr {-n name [-v value] | -x name} <path>]
[-setrep [-R] [-w] <rep> <path> ...]
[-stat [format] <path> ...]
[-tail [-f] <file>]
[-test -[defsz] <path>]
[-text [-ignoreCrc] <src> ...]
[-touchz <path> ...]
[-usage [cmd ...]]
Generic options supported are
-conf <configuration file> specify an application configuration file
-D <property=value> use value for given property
-fs <local|namenode:port> specify a namenode
-jt <local|resourcemanager:port> specify a ResourceManager
-files <comma separated list of files> specify comma separated files to be copied to the map reduce cluster
-libjars <comma separated list of jars> specify comma separated jar files to include in the classpath.
-archives <comma separated list of archives> specify comma separated archives to be unarchived on the compute machines.
The general command line syntax is
bin/hadoop command [genericOptions] [commandOptions]

常用命令

(1)-help:輸出這個命令引數

bin/hdfs dfs -help rm

(2)-ls: 顯示目錄資訊

hdfs dfs -ls /

(3)-mkdir:在hdfs上建立目錄

hdfs dfs -mkdir -p /aaa/bbb/cc/dd

(4)-moveFromLocal從本地剪下貼上到hdfs

hdfs dfs -moveFromLocal /home/Hadoop/a.txt /aaa/bbb/cc/dd

(5)-moveToLocal:從hdfs剪下貼上到本地

hdfs dfs -moveToLocal /aaa/bbb/cc/dd /home/Hadoop/a.txt

(6)--appendToFile :追加一個檔案到已經存在的檔案末尾

hdfs dfs -appendToFile ./hello.txt /hello.txt

(7)-cat :顯示檔案內容

hdfs dfs -cat /hadoop-daemon.sh

(8)-tail:顯示一個檔案的末尾

hdfs dfs -tail /weblog/access_log.1

(9)-text:以字元形式列印一個檔案的內容

hdfs dfs -text /weblog/access_log.1

(10)-chgrp 、-chmod、-chown:linux檔案系統中的用法一樣,修改檔案所屬許可權

hdfs dfs -chmod 666 /hello.txt
hdfs dfs -chown someuser:somegrp /hello.txt

(11)-copyFromLocal:從本地檔案系統中拷貝檔案到hdfs路徑去

hdfs dfs -copyFromLocal ./jdk.tar.gz /aaa/

(12)-copyToLocal:從hdfs拷貝到本地

hdfs dfs -copyToLocal /aaa/jdk.tar.gz

(13)-cp :從hdfs的一個路徑拷貝到hdfs的另一個路徑

hdfs dfs -cp /aaa/jdk.tar.gz /bbb/jdk.tar.gz.2

(14)-mv:在hdfs目錄中移動檔案

hdfs dfs -mv /aaa/jdk.tar.gz /

(15)-get:等同於copyToLocal,就是從hdfs下載檔案到本地

hdfs dfs -get /aaa/jdk.tar.gz

(16)-getmerge :合併下載多個檔案,比如hdfs的目錄 /aaa/下有多個檔案:log.1, log.2,log.3,...

hdfs dfs -getmerge /aaa/log.* ./log.sum

(17)-put:等同於copyFromLocal

hdfs dfs -put /aaa/jdk.tar.gz /bbb/jdk.tar.gz.2

(18)-rm:刪除檔案或資料夾

hdfs dfs -rm -r /aaa/bbb/

(19)-rmdir:刪除空目錄

hdfs dfs -rmdir /aaa/bbb/ccc

(20)-df :統計檔案系統的可用空間資訊

hdfs dfs -df -h /

(21)-du統計資料夾的大小資訊

hdfs dfs -du -s -h /aaa/*

(22)-count:統計一個指定目錄下的檔案節點數量

hdfs dfs -count /aaa/

(23)-setrep:設定hdfs中檔案的副本數量

hdfs dfs -setrep 3 /aaa/jdk.tar.gz

這裡設定的副本數只是記錄在namenode的元資料中,是否真的會有這麼多副本,還得看datanode的數量。因為目前只有3臺裝置,最多也就3個副本,只有節點數的增加到10臺時,副本數才能達到10。

Hadoop Shell命令 - 01

(24) - expunge :清空hdfs垃圾桶

hdfs dfs -expunge