1. 程式人生 > >Sqoop匯入資料文字格式和Sequence File的比較

Sqoop匯入資料文字格式和Sequence File的比較


Sqoop可以匯入資料到一些不同的檔案格式。

文字格式:

文字格式(預設格式)提供一種便於人閱讀的資料格式,
這種格式平臺無關性,是最簡單的結構。
但是,這種檔案格式,不可以處理二進位制欄位(例如資料庫中列中的可變二進位制型別欄位);
不能區分出空值和包含null的字串。

SequenceFile:
解決了文字格式的缺點。

序列化檔案提供了,更精確的匯入資料的替代方法的可能性。

它也允許資料壓縮,
同時保持了Mapreduce平行的處理同一個檔案不同部分的能力。

序列化檔案的缺點是,
他們是Java特定的,並且目前Sqoop版本不能將其匯入到Hive中。