1. 程式人生 > >Hive幾種資料匯出方式

Hive幾種資料匯出方式

轉自http://www.iteblog.com/archives/955

  寫在前面的話,學Hive這麼久了,發現目前國內還沒有一本完整的介紹Hive的書籍,而且網際網路上面的資料很亂,於是我決定寫一些關於《Hive的那些事》序列文章,分享給大家。我會在接下來的時間整理有關Hive的資料,如果對Hive的東西感興趣,請關注本部落格。http://www.iteblog.com/archives/tag/hive的那些事

  在本部落格的《Hive幾種資料匯入方式》文章中,談到了Hive中幾種資料的匯入方式,不同的資料匯入方式用途不一樣。今天我們再談談Hive中的幾種不同的資料匯出方式。可以根據匯出的地方不一樣,將這些方式分為三種:(1)、匯出到本地檔案系統;(2)、匯出到HDFS中;(3)、匯出到Hive的另一個表中。為了避免單純的文字,我將一步一步地用命令進行說明。

  一、匯出到本地檔案系統

1
2 hive> insert overwrite local directory '/home/wyp/wyp'
3 > select * from wyp;

  這條HQL的執行需要啟用Mapreduce完成,執行完這條語句之後,將會在本地檔案系統的/home/wyp/wyp目錄下生成檔案,這個檔案是Reduce產生的結果(這裡生成的檔名是000000_0),我們可以看看這個檔案的內容:

1
[wyp@master ~/wyp]$ vim 000000_0
2 5^Awyp1^A23^A131212121212
3 6^Awyp2^A24^A134535353535
4 7^Awyp3^A25^A132453535353
5 8^Awyp4^A26^A154243434355
6 1^Awyp^A25^A13188888888888
7
2^Atest^A30^A13888888888888
8 3^Azs^A34^A899314121

可以看出,這就是wyp表中的所有資料。資料中的列與列之間的分隔符是^A(ascii碼是\00001)。

  和匯入資料到Hive不一樣,不能用insert into來將資料匯出:
01
02 hive> insert into local directory '/home/wyp/wyp'

相關推薦

Hive資料匯出方式

轉自http://www.iteblog.com/archives/955   寫在前面的話,學Hive這麼久了,發現目前國內還沒有一本完整的介紹Hive的書籍,而且網際網路上面的資料很亂,於是我決定寫一些關於《Hive的那些事》序列文章,分享給大家。我會在

http協議基礎(三)資料傳輸方式

說說http協議的一些特點: 1)無狀態 http協議是一種自身不對請求和響應之間的通訊狀態進行儲存的協議,即無狀態協議。 這種設定的好處是:更快的處理更多的請求事務,確保協議的可伸縮性 不過隨著web的不斷髮展,有時候,需要將這種狀態進行保持,隨即,就引入了cookie技術,cookie技術通過在請

Hbase資料入庫方式比較

import java.io.IOException; import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; import org.apache.hadoop.conf.Configurati

hive學習 —Hive匯出資料方式

如果資料檔案恰好是使用者需要的格式,那麼只需要拷貝檔案或資料夾就可以。 hadoop fs –cp source_path target_path 2.匯出到本地檔案系統 --不能使用insert into local directory來匯出資料,會報錯 --只能使用insert over

Hive表中四不同資料匯出方式以及如何自定義匯出列分隔符

問題導讀: 1、Hive表資料四種匯出方式是? 2、匯出命令中LOCAL的作用及有無的區別? 3、匯出命令中是否可以嚮導入命令一樣使用INTO? 4、如何自定義匯出檔案的列分隔符? 5、hive的-e和-f引數的作用及如何使用其來匯出資料? 6、hive shell環境中

HIVE的安裝配置、mysql的安裝、hive建立表、建立分割槽、修改表等內容、hive beeline使用、HIVE的四資料匯入方式、使用Java程式碼執行hive的sql命令

1.上傳tar包 這裡我上傳的是apache-hive-1.2.1-bin.tar.gz 2.解壓 mkdir -p /home/tuzq/software/hive/ tar -zxvf apache-hive-1.2.1-bin.tar.gz  -C /home/

postman的資料提交的方式,以及提交方式的介紹

    1、form-data:                     就是http請求中的multipart/form-data,它會將表單的資料處理為一

hive執行sql的方式總結

在命令列介面下,我們來看看hive sql的幾種執行方式: [email protected] hive-0.13.1]$ bin/hive -help usage: hive -d, --define <key=value>         Vari

Hbase資料入庫(load)方式比較

1. 預先生成HFile入庫 2. 通過MapReduce入庫 /* MapReduce 讀取hdfs上的檔案,以HTable.put(put)的方式在map中完成資料寫入,無reduce過程*/ import java.io.IOException; import or

python: websocket獲取實時資料常見連結方式

第一種, 使用create_connection連結,需要pip install websocket-client (此方法不建議使用,連結不穩定,容易斷,並且連線很耗時) import time from websocket import create_co

資料處理框架的場景比較:傳統ETL工具、Mapreduce、Hive、Spark

ref: http://www.sohu.com/a/155141436_151779提起“大資料”就不得不提起有關資料的處理,雖然有人說過大資料在資料質量方面的要求不比傳統資料的要求那麼嚴格,當然這也是分場景的斷言,但是無論何時資料處理在大資料的生態中始終處於不可缺少的地位

nginx upstream 常用的調度方式

均衡 gin 字節 默認 結果 根據 主機 upstream 指定 nginx可以根據客戶IP進行負載均衡,在upstream裏設置ip_hash,以可以對同一個C類地址段的客戶端選擇同一個後端服務器,除非那個後端服務器宕了才會換一個.C類地址:C類地址第1字節、第2字節和

Vue2 常見開局方式

fig elm temp common disable .... false app oot 在SF問題中看到了一個關於vue-cli中的template問題,問題是這樣的:用vue-cli工具生成的main.js中: import Vue from ‘vue‘ i

最近接觸的APP支付方式——支付寶支付

.net core 很多 app 用法 http 相同 沒有 圖片 app支付 項目是在VS2017上、基於.net core 開發的web api 接口 所有的支付接入之前都要先申請好自己的商戶平臺,還有有一個賬戶用於測試使用,這些沒有事先配置好,那麽接下來的開發會無從下

愛創課堂每日一題第五十八天-javascript對象的創建方式

前端 前端學習 前端入門 北京前端1,工廠模式2,構造函數模式3,原型模式4,混合構造函數和原型模式5,動態原型模式6,寄生構造函數模式7,穩妥構造函數模式愛創課堂每日一題第五十八天-javascript對象的幾種創建方式

javascript對象的創建方式整理

添加 屬性和方法 {} ceo this scrip 方法 alert type 1.工廠模式 //工廠模式雖然解決了創建多個相似對象的問題,但卻沒有解決對象識別的問題(即怎樣知道一個對象的類型)。 function createPerson(name,age,job){

JS對象的創建方式

push 排序 pos 即使 重復字符 order data 默認 返回值 1、join() join(separator): 將數組的元素組起一個字符串,以separator為分隔符,省略的話則用默認用逗號為分隔符,該方法只接收一個參數:即分隔符。 1 2

SQL Server中遍歷方式比較

不同 .com font size 常用 分享 分享圖片 遊標 inf SQL遍歷解析   在SQL的存儲過程,函數中,經常需要使用遍歷(遍歷table),其中遊標、臨時表等遍歷方法很常用。面對小數據量,這幾種遍歷方法均可行,但是面臨大數據量時,就需要擇優選擇,不同的遍歷方

應用層與內核的通信方式

物理內存 是什麽 nts iat 其他 輸入緩沖 BE virt getc 應用程序與驅動程序據我所知,細分可以分6種,ReadFile,WirteFile方式的緩沖區設備讀寫,直接方式讀寫,和其他方式讀寫。Io設備控制操作(即DeviceControl)的緩沖內存模式IO

創建線程有不同的方式?你喜歡哪一?為什麽?

什麽 all HR thread 同時 應用設計 創建線程 callable 應用程序 創建線程有四種不同的方式: 1、繼承Thread類 2、實現Runnable接口 3、應用程序可以使用Executor框架來創建線程池 4、實現Callable接口 我更喜歡實現Ru