Sqoop1.99 從SQL Server導資料到HDFS

阿新 • • 發佈：2018-11-19

一、建立link

1.建立mssql 的link

啟動sqoop2-shell

設定埠 set server --host master --port 12000 --webapp sqoop

建立連線 create link -c generic-jdbc-connector

Name: mssql
JDBC Driver Class: com.microsoft.sqlserver.jdbc.SQLServerDriver
JDBC Connection String:jdbc:sqlserver://1xxx.xxx:1433;databaseName=xxx
Username: sa
Password: ***********
JDBC Connection Properties: 
There are currently 0 values in the map:
entry#

埠號可以通過執行exec sys.sp_readerrorlog 0, 1, 'listening'來檢視，或者在wind的cmd裡面通過netstat -ano配合tasklist |findstr ""來檢視

2.建立hdfs的link

create link -c hdfs-connector

Name: hdfs
HDFS cluster
URI: hdfs://192.168.116.10:9000
Conf directory: /usr/local/src/hadoop-2.6.1/etc/hadoop

二、建立job

create job -f mssql -t hdfs

Name: mssqltohdfs

From database configuration

Schema name: dbo      #這裡填dbo
Table name: xxxx
Table SQL statement: 
Table column names: 
Partition column name: xxxx
Null value allowed for the partition column: 
Boundary query: 

ToJob configuration

Output format: 
  0 : TEXT_FILE
  1 : SEQUENCE_FILE
Choose: 0
Compression format: 
  0 : NONE
  1 : DEFAULT
  2 : DEFLATE
  3 : GZIP
  4 : BZIP2
  5 : LZO
  6 : LZ4
  7 : SNAPPY
  8 : CUSTOM
Choose: 3        #這裡選擇gzip壓縮，可以被hive直接識別
Custom compression format: 
Output directory: /sqoop/hdfs

Throttling resources

Extractors:           #這兩個相當於map 和reduce的個數
Loaders:

三、開啟任務

start job -n mssqltohdfs

檢視進度 status job -n mssqltohdfs

設定檢視報錯資訊set option --name verbose --value true

可以看http://192.168.116.10:8088/cluster檢視看進度

或者到http://192.168.116.10:19888/jobhistory/檢視日誌情況，可以看到任務執行完成了

到hdfs裡面檢視一下是否成功匯入資料了：hdfs dfs -ls /sqoop/hdfs

可以看到有很多gz檔案，已經成功匯入了。

Sqoop1.99 從SQL Server導資料到HDFS

一、建立link 1.建立mssql 的link 啟動sqoop2-shell 設定埠 set server --host master --port 12000 --webapp sqoop 建立連線 create link -c generic-j

Logstash : 從 SQL Server 讀取資料

有些既存的專案把一部分日誌資訊寫入到資料庫中了，或者是由於其它的原因我們希望把關係型資料庫中的資訊讀取到 elasticsearch 中。這種情況可以使用 logstash 的 jdbc input 外掛從關係型資料庫中讀取日誌資料，然後輸出到 elasticsearch 中。本文介紹如何在 windows

SQL Server BCP 資料導入導出

nag 視圖之間 lac _id 控制參數 har tle SQL Server BCP 導入導出使用 Bcp 導出導入數據高效，比使用SQL Server Management Stdio 提供的數據庫導出導入要高效因為sql server 也沒有提供提供類似

SQL Server導入報錯：The LocaleID 4 is not installed on this system

code page localeid 936 問題描述：通過SQLServer導入導出向導導入中文字符集數據，遇到The LocaleID 4 is not installed on this system.錯誤。解決方法：我發現客戶服務器操作系統雖然不支持Chinese (Simplified)

Sql Server 導入還有一個數據庫中的表數據

數據庫 tex .net mark manage alt img 資源管理一個數據庫在涉及到SQL Server編程或是管理時一定會用到數據的導入與導出, 導入導出的方法有多種，此處以SQL Server導入表數據為例。闡述一下：1、打開SQL Server Mana

sql server導入excel數據，字符串類型變成float

類型轉換文字解決導入導入excel 保存下一步 exce 如secel中身份證字段，sql server導入後該字段變成float類型，字符串數據變成null，解決方法：直接將excel中的這一列全部轉為了文本格式。點擊excel中的轉換列，菜單中點選數據--

SQL server 導出平面文件時出錯： The code page on Destination - 3_txt.Inputs[Flat File Destination Input].Columns[UserId] is 936 and is required to be 1252.

log 解決辦法驗證 AI inpu image ans post BE 我在導出平面文件時：Error 0xc00470d4: Data Flow Task 1: The code page on Destination - 3_txt.Inputs[Flat File

PowerDesigner逆向工程，從SQL Server數據庫生成Physical Model -----數據源方式

eve next mod 數據庫 design 逆向圖片工程 database 1.File-Reverse Engineer-Database 2.DBMS選擇SQL Server 3. 4. 5. 6. 7. 8

SQL server 匯出資料之後身份證後四位全變成0的問題

負責一個專案的時候經常會遇到匯出資料的問題，而且每次匯出的欄位都不一樣，於是總結出了一個很方便的辦法，並且匯出來的資料不會變成科學計數，身份證後四位也不會全變成0，下面是步驟：第一步：開啟SQL server，用select語句把需要匯出的資料查詢出來。第二步：查詢所

Sql Server資料庫資料恢復成功案例

故障描述： 5塊2T硬碟組建RAID5，劃分LUN供windows伺服器使用。在windows伺服器內裝有Sql Server2008資料庫。儲存空間內共有三個邏輯分割槽，大小分別為500G、800G、2.3T。資料庫檔案丟失，主要涉及五個資料庫，表個數約為6000個左右。丟失原因未知，且不能確

sql server 還原資料

1 有兩個 sql server資料庫的備份,分別是gdda45.bak, auth1023.bak 首先, 使用windows登入認證的方式登入' '. 右鍵資料庫,還原,然後選擇備份檔案,注意目標資料庫的名稱與備份的資料庫名稱一致

SQL Server插入資料和刪除資料

首先在我的Student表中插入幾條資料，由於我的表已經建立完成了，所以就沒有建立表的 sql 語句了，不過可以看我的上一篇文章： http://www.cnblogs.com/Brambling/p/6649350.html 插入資料sql語句： 1 　insert into Student(S

Sql Server 導出數據庫表結構的SQL查詢語句

條件語句 val isnull tex ren pro scale bsp 1 --導出數據庫所有表 2 3 SELECT 4 表名 = Case When A.colorder=1 Then D.name Else ‘‘ End, 5

SQL server匯入資料格式為科學

問題描述：Excel匯入資料庫的時候，有一列資料是九位數字如72020693 匯入以後預設為float型別我要把它改成nvarchar型別，直接修改了以後，他就會變成7202+e07的形式（因為已經改好了沒有具體的例子）後來我就把這列(欄位名為CostC

SQL Server 中資料查詢注意事項

1.查詢語句不用區分大小寫，而且即使每張表的表名或者列名出現大寫字母，在寫查詢語句的時候也不用區分大小寫，查詢結果保持一致，所以查詢語句小寫即可。 2.在寫查詢語句的時候列名不需要帶單引號，數值型的字串不用帶引號，需要帶引號的是字元型和漢字型的字串。 3.如果既要用到group by子句，也要用到orde

從SQL Server CloudDBA 看雲資料庫智慧化

最近阿里雲資料庫SQL Server在控制檯推出了CloudDBA服務，重點解決資料庫效能優化領域問題，幫助客戶更好的使用好RDS資料庫，這是繼MySQL之後第二個關係型資料庫提供類似的服務。資料庫可認為是系統執行的關鍵，因為它儲存資料，確保事務一致性，是企業的核心資產。一般

sql server 大批資料插入時，時間過長的問題

private const string con = "server=192.168.30.36;database=test;user=sa;pwd=123456"; static void Main(string[] args) { DataT

sql server 資料庫資料字典指令碼

use YourDatabase --指定要生成資料字典的資料庫 go SELECT 表名=case when a.colorder=1 then d.name else '' end, 表說明=case when a.colorder=1 then isnull(

SQL Server——保證資料的完整性（使用者自定義資料型別、使用規則、解除和刪除規則）

目錄一、使用者自定義資料型別二、使用規則規則和CHECK約束的比較：三、解除和刪除規則一、使用者自定義資料型別使用者自己設計並實現的資料型別就是使用者自定義資料型別。舉例：當幾個表中要存同種資料型別時，並且保證他們有相同的資料型別、長度和

從 SQL Server 到 MySQL （一）：異構資料庫遷移

背景滬江成立於 2001 年，作為較早期的教育學習網站，當時技術選型範圍並不大： Java 的版本是 1.2，C# 尚未誕生，MySQL 還沒有被 Sun 收購，版本號是 3.23。工程師們選擇了當時最合適的微軟體系，並在日後的歲月裡，逐步從 ASP 過度到 .net，資料庫也跟隨 SQL Ser

Sqoop1.99 從SQL Server導資料到HDFS

相關推薦