1. 程式人生 > >Sqoop匯入與匯出底層

Sqoop匯入與匯出底層

1.Sqoop匯入底層工作原理

(1)在匯入前,Sqoop使用JDBC來檢查將要匯入的資料表。 (2)Sqoop檢索出表中所有的列以及列的SQL資料型別。 (3)把這些SQL型別的對映到java資料型別,例如(VARCHAR、INTEGER)———>(String,Integer)。 (4)在MapReduce應用中將使用這些對應的java型別來儲存欄位的值。 (5)Sqoop的程式碼生成器使用這些資訊來建立對應表的類,用於儲存從表中抽取的記錄。 注意:對於匯入來說,更關鍵的是DBWritable介面的序列化方法,這些方法能使(生成的類)和JDBC進行互動。

2.Sqoop匯出底層工作原理

(1)在匯出前,sqoop會根據資料庫連線字串來選擇一個匯出方法  ————>對於大部分系統來說,sqoop會選擇JDBC。

(2)Sqoop會根據目標表的定義生成一個java類。

(3)這個生成的類能夠從文字中解析出記錄,並能夠向表中插入型別合適的值(除了能夠讀取ResultSet中的列)。 (4)然後啟動一個MapReduce作業,從HDFS中讀取源資料檔案。 (5)使用生成的類解析出記錄,並且執行選定的匯出方法。

相關推薦

Sqoop匯入匯出底層

1.Sqoop匯入底層工作原理 (1)在匯入前,Sqoop使用JDBC來檢查將要匯入的資料表。 (2)Sqoop檢索出表中所有的列以及列的SQL資料型別。 (3)把這些SQL型別的對映到java資

[Sqoop]Sqoop匯入匯出

1. 匯入例項1.1 登陸資料庫查看錶[email protected]:~$ mysql -u root -pEnter password:Welcome to the MySQL monitor.Commands end with ; or \g.YourMyS

sqoop學習2(資料匯入匯出命令)

最近學習了下這個導資料的工具,但是在export命令這裡卡住了,暫時排不了錯誤。先記錄學習的這一點吧sqoop是什麼sqoop(sql-on-hadoop):是用來實現結構型資料(如關係型資料庫)和hadoop之間進行資料遷移的工具。它充分利用了mapreduce的並行特點以

c# ASP.NET MVC模式 WPS的匯入匯出的實現

前提準備:  1.想要成功進行WPS的匯入與匯出,你得先下載WPS,然後找到etapi.dll檔案(路徑:\Kingsoft\WPS Office\10.1.0.7520\office6),WPS安裝路徑看你們具體的安裝路徑。  2.然後在自己的ASP.NET MVC

MySQL資料庫的匯入匯出

一.MYSQL的命令列模式的設定:  桌面->我的電腦->屬性->環境變數->新建->PATH=";path/mysql/bin;"其中path為MYSQL的安裝路徑。 注:如果你的mysql命令以加入到環境變數,則不需要第一步,二.命令列進入MYSQL的

百萬級流水匯入匯出(千萬級未測試)

百萬級流水寫入檔案,再從檔案中寫入資料庫 千萬級資料量未測試 Laravel 中進行的除錯 class BusinessFlowsHistoryJob extends Job { public function __construct() { }

HIVE資料的匯入匯出詳解

1.匯入 load data [local] inpath ''  [overwrite]  into database.table [partition(partcol=val)] 原始檔案在linux本地 加上local 如果原始資料檔案在hdfs 不用local

linux上資料庫匯入匯出(mysql)

匯入資料庫 1.建立資料庫。  create database stillmealdbs; 2.linux下檢視Mysql預設編碼、修改預設編碼 檢視MySQL資料庫的預設編碼        1使用status

Matlab檔案和資料的匯入匯出

ref: https://blog.csdn.net/zengzeyu/article/details/72530596 Matlab檔案和資料的匯入與匯出 2017年05月19日 15:18:35 周吳鄭王 閱讀數:740

資料庫實驗課堂作業- 5.資料庫的備份還原 匯入匯出

資料庫實驗課堂作業 5.資料庫的備份與還原 匯入與匯出 --5.1.3 內容: (1)將School資料庫的恢復模式設定為“完整”。 (2)為School資料庫建立一個新的備份裝置

Sqoop1 匯入匯出資料

https://blog.csdn.net/HG_Harvey/article/details/77985857 sqoop的參考 實習要求從hive裡把分割槽表匯出到oracle裡 指令碼:hiveORCL.op export --connect jdbc:oracle:thi

Mysql的資料匯入匯出

2018年11月14日 18:38:32 wyh1128 閱讀數:6 標籤: mysql

匯入匯出mysql資料庫

切記不要在powershell內進行操作  不然報錯: ERROR: Unknown command '\n'. ERROR: ASCII '\0' appeared in the statement, but this is not allowed unless opti

POI操作excel的匯入匯出

    趁著不忙,抽空寫了個用poi操作excel匯入匯出的功能的小例子。不多說,直接上程式碼! poi的操作類: package com.bao.excelUtil; import java.io.File; import java.io.FileInputStrea

docker映象檔案匯入匯出

因為公司內網不能直接pull docker映象,只能先下載docker映象,再copy到內網。  1)使用 save命令將 映象儲存為檔案       docker save -o  自定義檔名.tar  已存在的映象名  2)將檔案copy到內網  3) 使用load命令將

C# NPOI匯入匯出Excel

使用 NPOI 你就可以在沒有安裝 Office 或者相應環境的機器上對 WORD/EXCEL 文件進行讀寫。 環境:.Net 4.0 NPOI版本:2.2 引用DLL ICSharpCode.SharpZipLib.dll NPOI.dll NPOI.OOXML.dll

C# NPOI 匯入匯出Excel文件 相容xlsx, xls

下面附上給我提示的部落格: 這裡使用的NPOI版本為: 2.1.3.1 版本內包含.Net 2.0 與.Net 4.0 .Net 4.0中包含檔案 使用時需引用需要引用所有5個dll 使用到的引用 using NPOI.HSSF.UserModel

玩轉Vagrant之工作環境的遷移(box的匯入匯出

一、匯出篇 首先,大家知道,vagrant的執行是依託於VirtualBox這個虛擬機器軟體的,那麼我們首先找到VirtualBox的安裝位置,我的VirtualBox安裝在E:\Program Files\Oracle\VirtualBox,這個目錄下,我們使用cmd(注

JAVA中實現對Excel的匯入匯出

1 使用Jxl實現Excel的匯入與匯出 1 ) 新建實體類Book package com.bean; public class Book { private Integer id ; private String name ; private String

資料庫實驗課堂作業- 5.資料庫的備份還原 匯入匯出

資料庫實驗課堂作業 5.資料庫的備份與還原 匯入與匯出 --5.1.3 內容: (1)將School資料庫的恢復模式設定為“完整”。 (2)為School資料庫建立一個新的備份裝置。 (3)為School資料庫分別建立一個完整備份,差異備份和事務日