sqoop 的安裝與常用抽數操作

阿新 • • 發佈：2018-04-12

大數據 hadoop sqoop 抽取數據

sqoop 簡介處理

sqoop 環境配置處理

sqoop 數據導入導出處理

一： sqoop 簡介處理

- 1. Sqoop是一個用來將Hadoop和關系型數據庫中的數據相互轉移的工具，可以將一個關系型數據庫（例如 ： MySQL ,Oracle ,Postgres等）中的數據導進到Hadoop的HDFS中，也可以將HDFS的數據導進到關系型數據庫中。

- 2. Sqoop中一大亮點就是可以通過hadoop的mapreduce把數據從關系型數據庫中導入數據到HDFS，可以將hive 的數據，hdfs 上面的數據進行 提取的到關系型數據當中。 反之亦可操作。

二：sqoop 安裝與配置處理：

 環境需求： 安裝好的hadoop環境與hive 環境已經配置。

2.1 配置單節點的zookeeper 環境

tar -zxvf zookeeper-3.4.5-cdh5.3.6.tar.gz 
mv zookeeper-3.4.5-cdh5.3.6 yangyang/zookeeper
cd yangyang/zookeeper/conf
cp -p zoo_sample.cfg zoo.cfg

2.2 給定zookeeper 的Datadir 目錄：

# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
#dataDir=/tmp/zookeeper
<!--給定dataDir 目錄 -->
dataDir=/home/hadoop/yangyang/zookeeper/data
# the port at which the clients will connect

echo "1" > /home/hadoop/yangyang/zookeeper/myid

2.3 啟動zookeeper服務

  cd /home/hadoop/yangyang/zookeer/sbin/
  ./zkServer.sh start

技術分享圖片

 tar -zxvf sqoop-1.4.5-cdh5.3.6.tar.gz
 mv sqoop-1.4.5-cdh5.3.6 yangyang/sqoop
 cp -p mysql-connector-java-5.1.27-bin.jar /home/hadoop/yangyang/sqoop/lib/
 cd yangyang/sqoop/conf
 cp -p sqoop-env-template.sh sqoop-env.sh

2.4 配置sqoop環境

vim sqoop-env.sh

#Set path to where bin/hadoop is available
<!--配置hadoop目錄-->
export HADOOP_COMMON_HOME=/home/hadoop/yangyang/hadoop

#Set path to where hadoop-*-core.jar is available
<!--配置hadoop的mapreduce目錄-->
export HADOOP_MAPRED_HOME=/home/hadoop/yangyang/hadoop
<!--配置hbase 目錄>
#set the path to where bin/hbase is available
#export HBASE_HOME=

#Set the path to where bin/hive is available
<!--配置hive的目錄-->
export HIVE_HOME=/home/hadoop/yangyang/hive
<!--配置zookeeper 的目錄處理>
#Set the path for where zookeper config dir is
export ZOOCFGDIR=/home/hadoop/yangyang/zookeeper/conf

二：sqoop 的環境測試處理

2.1 在mysql 的環境下創建數據庫，並創建表處理

mysql -uroot -p123456
create database yangyang;
use yangyang;

創建一個my_user表：
CREATE TABLE `my_user` (
  `id` tinyint(4) NOT NULL AUTO_INCREMENT,
  `account` varchar(255) DEFAULT NULL,
  `passwd` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
);
插入數據：
INSERT INTO `my_user` VALUES (‘1‘, ‘admin‘, ‘admin‘);
INSERT INTO `my_user` VALUES (‘2‘, ‘pu‘, ‘12345‘);
INSERT INTO `my_user` VALUES (‘3‘, ‘system‘, ‘system‘);
INSERT INTO `my_user` VALUES (‘4‘, ‘zxh‘, ‘zxh‘);
INSERT INTO `my_user` VALUES (‘5‘, ‘test‘, ‘test‘);
INSERT INTO `my_user` VALUES (‘6‘, ‘pudong‘, ‘pudong‘);
INSERT INTO `my_user` VALUES (‘7‘, ‘qiqi‘, ‘qiqi‘);

三：將mysql的數據表導入到hdfs 上面：

3.1 sqoop 導入不指定目錄：

bin/sqoop import --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table my_user
導出的路徑在hdfs 上面的目錄是
/usr/hadoop/my_user/
註意：
不指定導入目錄，默認情況是導入到hdfs上面用戶家目錄下面。
默認導入到HDFS裏面，分隔符是,

3.2 導入帶目錄路徑：

bin/sqoop import --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table my_user --target-dir /db_0521/ -m 1 --delete-target-dir --fields-terminated-by ‘\t‘ --direct

技術分享圖片

3.3 增量導入：

bin/sqoop import --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table my_user --target-dir /db_0521/ -m 1 --fields-terminated-by ‘\t‘ --direct --check-column id --incremental append --last-value 4

技術分享圖片

3.4 從mysql 導入hive 當中：

bin/sqoop import --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table my_user --delete-target-dir --hive-import --hive-database yangyang --hive-table mysql2hive --fields-terminated-by ‘\t‘

技術分享圖片

3.5 從hdfs 當中導出mysql 當中：

新建一張空表：
create table hdfs2mysql like my_user;
導出命令
bin/sqoop export --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table hdfs2mysql --export-dir /user/hive/warehouse/yangyang.db/mysql2hive --input-fields-terminated-by ‘\t‘

技術分享圖片

從hive 當中導出到mysql 當中：
註意：其實就是從HDFS導入到RDBMS

新建一張空表：
create table hive2mysql like my_user;
導出命令：
bin/sqoop export --connect jdbc:mysql://namenode01.hadoop.com:3306/yangyang --username root --password 123456 --table hive2mysql --export-dir /user/hive/warehouse/yangyang.db/mysql2hive --input-fields-terminated-by ‘\t‘

技術分享圖片

sqoop 的安裝與常用抽數操作

大數據 hadoop sqoop 抽取數據 sqoop 簡介處理 sqoop 環境配置處理 sqoop 數據導入導出處理一： sqoop 簡介處理 - 1. Sqoop是一個用來將Hadoop和關系型數據庫中的數據相互轉移的工具，可以將一個關系型數據庫（例如： MySQL ,Or

SVN的安裝與常用功能使用以及解決安裝配置過程中的一些錯誤

三種方式安裝配置 ava -- 服務器工作流程圖例如完成網站 SVN簡介： SVN是Subversion的簡稱，是一個開放源代碼的版本控制系統，將工程代碼集中在服務器上進行一個統一的集中式管理，從而能夠方便地控制代碼版本，相較於RCS、CVS，它采用了分支管理系統

Fedora 安裝與常用命令

org 地址安裝 tps 下載 stage2 gpo 編輯 6.2 fedora下載地址： https://getfedora.org/ 原來裝的26，現在裝27 用的是server版網絡安裝500多M 現在都是U盤安裝了，fedora的寫優盤說明 https://f

1. python 字符串簡介與常用函數

rec nic 第一個 xxx 3.x 關於 print 工具 line 1. python中的字符串簡介與常用函數在python中，字符串變成了一個強大的處理工具集，他是不可變的，也就是說字符串包含字符與字符的順序，他不可以原處修改字符串是我們後面需要學習的稍大一點的

Anaconda 的安裝與常用命令

x86 channels logs channel 安裝包管理命令 tap ive onf Anaconda 自帶 Python 解釋器以及數據處理常用的第三方庫，可以非常方便地搭建 Python 環境。同時還自帶了 Conda 用來管理第三方庫，類似 Pip ，但是比

docker compose安裝與常用命令介紹及使用docker-compose執行一個進銷存管理系統

使用微服務架構的應用系統一般包含若干個微服務，每個微服務一般都會部署多個例項。如果每個微服務都要手動啟停，那麼效率之低，維護量之大可想而知 docker compose 是一個用於定義和執行多容器docker應用程式的工具安裝：下在並安裝適應系統版本的compose

numpy安裝與常用的屬性方法

最近兩個月沒有更新部落格是因為我在嘗試使用keras進行影象識別，然後裡面就使用到了numpy，今天我就來寫一下numpy為什麼在機器學習領域那麼使用的那麼多，現在我們先來安裝一下numpy 簡單介紹numpy numpy 底層採用c 語言編寫它的主要的使用領

windows 下 RabbitMQ 安裝與常用命令

轉載自https://www.cnblogs.com/ericli-ericli/p/5902270.html 最近學習 rabbitMQ 的配置，這裡只是做一個記錄。注意 rabbitMQ 的版本和 erlang 的版本的相容性。詳情見 https:/

linux安裝與常用命令

一從認識作業系統開始 1.1 作業系統簡介我通過以下四點介紹什麼是作業系統：作業系統（Operation System，簡稱OS）是管理計算機硬體與軟體資源的程式，是計算機系統的核心與基石；作業系統本質上是執行在計算機上的軟體程式；為使用者提供一個與系統互動

sqoop安裝與快速使用-----你想要的sqoop都在這裡

場景傳統型缺點，分散式儲存。把傳統型資料庫資料遷移。 Sqoop安裝部署 1)下載安裝包 2)解壓 tar -zxvf .tar 3)修改配置 vi sqoop-env.sh export HADOOP_COMMON_HOME=/root/hd/hadoop-2.8.4

Anaconda安裝與conda的基本操作

安裝Anaconda 下載安裝包：連結： https://www.anaconda.com/download/ 在該連結下下載對應python版本與電腦版本的安裝包，並進行安裝除去安裝目錄稍作調整，其他無需修改，直接安裝點next即可 conda 的基本操

docker 阿里雲安裝與常用命令

安裝沒得技術含量，看過菜鳥教程和純潔寫的部落格，感覺so easy 命令： yum install docker 啟動設定開機啟動 systemctl start docker.service systemctl enable docker.service &nb

git編譯安裝與常用命令

git編譯安裝與常用命令 ========================================= 一：編譯安裝與設定 1.1：簡介 github官網地址（下載原始碼包）：https://github.com/git/git.git git 在 windows mac

Linux作業系統安裝與常用指令介紹

Linux最初是由芬蘭赫爾辛基大學學生Linus Torvalds由於自己不滿意教學中使用的MINIX作業系統，所以在1990年底由於個人愛好設計出了LINUX系統核心。後來釋出於芬蘭最大的ftp伺服器上，使用者可以免費下載，所以它的周邊的程式越來越多，Linux本身也逐漸發展壯大起來，之後Linux在不到三

docker安裝、常用命令、操作

安裝linux虛擬機器 1）、VMWare、VirtualBox（安裝）； 2）、匯入虛擬機器檔案centos7-atguigu.ova； 3）、雙擊啟動linux虛擬機器;使用 root/ 123456登陸 4）、使用客戶端連線linux伺服器進行命

Java8函數式編程（一）：Lambda表達式類型與常用函數接口

led ebe 前言 eve 分享 3.1 integer water 代碼 [TOC] 1 前言最近在看一些開源項目的源碼，函數式編程風格的代碼無處不在，所以得要好好學一下了。 2 Lambda表達式類型無參數： Runnable noArguments = ()

Sqoop數據分析引擎安裝與使用

ase 數據庫表 hive list pass font table imp 任務 Sqoop數據分析引擎安裝與使用 ==>什麽是Sqoop ? Sqoop 是一個開源的數據處理引擎，主要是通過 JDBC 為媒介，在Hadoop（Hive）與傳統的關系

Anaconda的安裝與jupyter常用操作

一、Anaconda的安裝關於Anaconda的在windows上的安裝，我不做過多的贅述，大家可以參考部落格：https://ask.hellobi.com/blog/wangdawei/9786。這裡，需要說明一下為什麼選擇Anaconda？如果使用python進行各種開

docker虛擬化安裝配置與常用命令

sta 80端口 ubuntu map 虛擬化導出 6.5 關系版本一、Docker安裝配置 docker只有在centos6.5以上機器才能使用yum直接安裝，如果其他版本需要安裝centos擴展源epel。 docker官方文檔說要求Linux kernel至

elk5.x環境搭建與常用插件安裝

elk ELK 5.X 環境搭建與常用插件安裝環境介紹：ip: 192.168.250.131os: CentOS 7.1.1503 (Core)內存不要給的太低，至少4G吧，否則elasticsearch啟動會報錯。軟件及其版本這裏軟件包都解壓在了/opt下，註意！logstash-

sqoop 的安裝與常用抽數操作

一： sqoop 簡介處理

二：sqoop 安裝與配置處理：

2.1 配置單節點的zookeeper 環境

2.2 給定zookeeper 的Datadir 目錄：

2.3 啟動zookeeper服務

2.4 配置sqoop環境

vim sqoop-env.sh

二：sqoop 的環境測試處理

2.1 在mysql 的環境下創建數據庫，並創建表處理

三： 將mysql的數據表導入到hdfs 上面：

3.1 sqoop 導入不指定目錄：

3.2 導入帶目錄路徑：

3.3 增量導入：

3.4 從mysql 導入hive 當中：

3.5 從hdfs 當中導出mysql 當中：

相關推薦

三：將mysql的數據表導入到hdfs 上面：