利用Sqoop將MySQL海量測試資料匯入HDFS和HBase

阿新 • • 發佈：2019-01-23

宣告：作者原創，轉載註明出處。

一、安裝Sqoop

1、下載sqoop,解壓、資料夾重新命名

wget http://mirror.bit.edu.cn/apache/sqoop/1.4.6/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz

tar -zxvf sqoop-1.4.6.bin_hadoop-2.0.4.alpha.tar.gz  -C /root/hadoop/

mv sqoop-1.4.6.bin_hadoop-2.0.4.alpha sqoop-1.4.6

2、配置環境變數

vim /etc/profile

export 
 SQOOP_HOME=/root/hadoop/sqoop-1.4.6

export PATH = $PATH:$SQOOP_HME/bin

3、驗證

若正常顯示Sqoop版本資訊，則安裝配置成功：

[root@localhost ~ ] # sqoop version

二、建立資料庫和表

安裝MySql後，建立測試資料庫和測試表。

資料庫名：test

表結構：point(pointId int(10) PRIMARYKEY,pointName varchar(16),pointValue int(10))

三、shell指令碼生成測試資料

編寫Shell指令碼，此處的插入語句需要根據所建立的表結構來修改：

#！/bin/bash
i=1;
MAX_INSERT_ROW_COUONT=$1;
while(( $i <= $MAX_INSERT_ROW_COUNT ))
do
    mysql -uhive -phive test -e "insert into test.point(pointId,pointName,pointValue) values($i,'point"$i"',$i);"
    i=(($i+1))
done
exit 0

上述指令碼生成測試資料速度很慢，筆者生成1000萬條資料有如懷胎十月，歡迎建議，感謝！

四、MySql資料匯入

下載後解壓，將mysql-connector-java-5.1.45資料夾下的mysql-connector-java-5.1.44-bin.jar

包拷貝到$SQOOP_HOME/lib目錄下即可。

1、匯入HDFS

sqoop import --connect jdbc:mysql://localhost:3306/test --username hive --password hive  --table 
point

引數解析：

import：表示從傳統資料庫匯入資料到 HDFS/HIVE/HBASE等；

–connect：建立資料庫連線；

jdbc:mysql://localhost:3306/test：使用jdbc方式連線mysql資料庫，資料庫名為test；

–username：指定資料庫使用者名稱；

–password：指定資料庫密碼；

–table：指定表名

注意：

a)HDFS輸出目錄不能已經存在；

b)沒有指定-m或者splite-by時，即沒有指定並行度時，要匯入的表必須有主鍵，否則會出錯。

c)匯入到指定目錄：sqoop import –connect jdbc:mysql://localhost:3306/test –username hive –password hive –table point –target-dir /directory

如果沒有指定輸出目錄，預設在/user/root/下建立一個與表名一致的子目錄作為輸出目錄，匯入操作執行後，檢視HDFS中是否有匯入的檔案：

hdfs dfs -ls /user/root/point/

2、匯入HBase

sqoop import --connect jdbc:mysql://localhost:3306/test --username root --password root --table 
point --hbase-table HPoint --column-family info --hbase-row-key pointId --hbase-create-table

引數解析：

–hbase-table：指定匯入到HBase資料庫中某表；

–column-family：指定列族名；

–hbase-row-key：指定rowKey；

–hbase-create-table：表示按照引數建立HBase中的表；

最後，歡迎指正。喜歡的話，點個讚唄，請你吃蘋果。

利用Sqoop將MySQL海量測試資料匯入HDFS和HBase

宣告：作者原創，轉載註明出處。一、安裝Sqoop 1、下載sqoop,解壓、資料夾重新命名 wget http://mirror.bit.edu.cn/apache/sqoop/1.4.6/sqoop-1.4.6.bin_

使用sqoop將mysql中的資料匯入Hive時報錯

1.使用sqoop在hive中建立一個和mysql中資料結構一樣的表時報錯 ERROR manager.SqlManager: Error reading from database: java.sql.SQLException: Streaming result set [em

利用Sqoop將MySQL數據導入Hive中

sqoop參考http://www.cnblogs.com/iPeng0564/p/3215055.htmlhttp://www.tuicool.com/articles/j2yayyjhttp://blog.csdn.net/jxlhc09/article/details/168568731.list da

利用sqoop將hive資料匯入匯出資料到mysql

執行環境 centos 5.6 hadoop hive sqoop是讓hadoop技術支援的clouder公司開發的一個在關係資料庫和hdfs,hive之間資料匯入匯出的一個工具在使用過程中可能遇到的問題： sqoop依賴zookeeper，所以必須配置ZOOK

利用sqoop將hive和MySQL資料互匯入

1. hadoop、hive、MySQL安裝（略）啟動hadoop 執行start-all.sh start-dfs.sh start-yarn.sh 2. 下載sqoop 3. 解壓 #tar -zxvfsqoop-1.4.6.bin__hadoop-

利用sqoop將hive資料匯入Oracle中（踩的坑）

教程很多，這裡只說踩過的坑 1.下載sqoop時，還得下一個bin的包，拿到sqoop-1.4.6.jar 的包，放到hadoop的lib目錄下 2.匯入oracle，執行程式碼時，使用者名稱和表名必須大寫！且資料庫建表時表名必須大寫！示例程式碼： sqoop expo

使用sqoop將mysql 資料匯入hdfs時各種報錯

資訊 18/06/29 10:45:08 ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeException: java.lang.RuntimeException: java.sql.SQLExcepti

通過sqoop將mysql資料匯入到hive中進行計算示例

hive計算示例先將資料通過sqoop從mysql匯入hive，在hive執行mysql的查詢語句，得到與mysql一樣的執行結果步驟： mysql資料準備 account賬號表 detail收支資料表 CREATE TABLE

利用sqoop將hive資料匯入Oracle中

首先：如oracle則執行sqoop list-databases --connect jdbc:oracle:thin:@//192.168.27.235:1521/ORCL --username DATACENTER -P 來測試是否能正確連線資料庫　如mysql則執行sq

用sqoop將mysql的資料匯入到hive表中，原理分析

Sqoop 將 Mysql 的資料匯入到 Hive 中準備Mysql 資料如圖所示，準備一張表，資料隨便造一些，當然我這裡的資料很簡單。編寫命令編寫引數檔案個人習慣問題，我喜歡把引數寫到檔案裡，然後再命令列引用。 vim mysql-info， #

通過sqoop將MySQL資料庫中的資料匯入Hbase

從接觸到大資料到成功的實現一個功能期間走了不少彎路也踩了不少坑，這裡作為我的學習筆記也可以作為小白們的前車之鑑，少走彎路，有不正確之處，望指出環境準備： hadoop、hbase、sqoop、mys

用sqoop將mysql的資料匯入到hive表中

用sqoop將mysql的資料匯入到hive表中 1：先將mysql一張表的資料用sqoop匯入到hdfs中準備一張表需求將 bbs_product 表中的前100條資料導匯出來只要id brand_id和 na

sqoop將Mysql資料匯入Hive中

注：筆者用的是sqoop1.4.6版本一、將Mysql資料匯入Hive中命令： sqoop import -Dorg.apache.sqoop.splitter.allow_text_splitter=true --con

MySQL-8.0.12資料庫的解除安裝，安裝和海量sql資料匯入

最近學習mySQL，作為一名新手，遇到了三個問題。第一：如何解除安裝乾淨原來的mySQL; 第二：如何下載並正確安裝mySQL; &nb

利用python 將 mysql 資料進行抽取並清理成標準格式後存入MSSql 資料中

from pymongo import MongoClientfrom pymysql import connectimport pymssqlfrom datetime import datetime, timedeltaimport time Nagios 資料庫的IP 地址 NagiosDB_IP

利用shell將mysql中資料匯出到檔案和執行mysql語句

利用mysqldump匯出mysql資料匯出指定條件的資料庫命令格式 mysqldump -u使用者名稱 -p密碼 -h主機 -P埠資料庫名表名 --where "sql語句" > 路徑示例程式碼 #!/bin/bash #變數定義 host="127.0.

SparkSql將資料來源Hive中資料匯入MySql例項

背景：能看到這篇部落格的夥計兒，應該是充分理解了[理想是豐滿的現實是骨感] 這句名言了吧。為啥子這麼說呢，那就是不就是個SparkSql從hive匯入到mysql嗎有什麼技術含量，但是呢不斷地踩坑ing填坑ing。廢話不多說，直接上硬菜。 package co

在hadoop 裡安裝 sqoop 並把mysql資料匯入hdfs

hadoop 2.6.0 sqoop：sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 然後把sqoop 解壓。這裡解壓發生的問題是， tar: /home/luis：歸檔中找不到 tar: 由於前次錯誤，將以上次的錯誤狀態退出 ta

利用Flume將MySQL表資料準實時抽取到HDFS、MySQL、Kafka

軟體版本號 jdk1.8、apache-flume-1.6.0-bin、kafka_2.8.0-0.8.0、zookeeper-3.4.5叢集環境安裝請先測試；參考以下作者資訊，特此感謝；http://blog.csdn.net/wzy0623/article/detail

Python3將excel中的資料匯入mysql資料庫

import pymysql # xlrd 為 python 中讀取 excel 的庫，支援.xls 和 .xlsx 檔案 # import xlrd # openpyxl 庫支援 .xlsx 檔案的讀寫 from openpyxl.reader.excel import

利用Sqoop將MySQL海量測試資料匯入HDFS和HBase

一、安裝Sqoop

1、下載sqoop,解壓、資料夾重新命名

2、配置環境變數

vim /etc/profile

3、驗證

二、建立資料庫和表

三、shell指令碼生成測試資料

四、MySql資料匯入

1、匯入HDFS

引數解析：

2、匯入HBase

引數解析：

相關推薦