hive (二) ----- hive的常用操作

阿新 • • 發佈：2019-01-04

並且 class cluster clu spa task group by partition mapr

一、hive操作

1.創建表

CREATE TABLE t3(id int,name string,age int) PARTITIONED BY (Year INT, Month INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘,‘ ;

2.導出表結構+數據

EXPORT TABLE customers TO ‘/user/centos/tmp.txt‘;

3.排序

1）order全排序

order by 會對輸入做全局排序，因此只有一個reducer（多個reducer無法保證全局有序）。

只有一個reducer，會導致當輸入規模較大時，需要較長的計算時間。

select * from orders order by id asc ;

2）sort,map端排序,本地有序。

sort by不是全局排序，其在數據進入reducer前完成排序。

因此，如果用sort by進行排序，並且設置mapred.reduce.tasks>1，則sort by只保證每個reducer的輸出有序，不保證全局有序。

select * from orders sort by id asc ;

3）distribute by

類似於mysql的group by,進行分區操作。

按照指定的字段對數據進行劃分到不同的輸出reduce文件中。

select cid , ... from orders distribute by cid sort by name ;            //註意順序.

select id,orderno,cid from orders distribute by cid sort by cid desc ;

4）cluster by

除了具有 distribute by 的功能外還兼具 sort by 的功能。

但是排序只能是倒序排序，不能指定排序規則為asc 或者desc

cluster by ===>  distribute by cid sort by cid

4.設置作業參數

set hive.exec.reducers.bytes.per.reducer=xxx            //設置reducetask的字節數。
set hive.exec.reducers.max=0                    //設置reduce task的最大任務數
set mapreduce.job.reduces=0                    //設置reducetask個數。

5.函數

mysql>select concat(‘tom‘,1000) ;
$hive>select current_database(),current_user() ;
$hive>tab                                            //查看幫助

hive (二) ----- hive的常用操作

並且 class cluster clu spa task group by partition mapr 一、hive操作 1.創建表 CREATE TABLE t3(id int,name string,age int) PARTITIONED BY (Year IN

Hive命令列常用操作（資料庫操作，表操作）

資料庫操作檢視所有的資料庫 hive> show databases ; 使用資料庫default hive> use default; 檢視資料庫資訊 hive > describe data

python接口自動化測試二：常用操作

響應狀態 coo 寫入 content 接口自動化測試文件編碼格式 post ESS url = ‘接口地址‘ r = requests.get(url) 　　 # 發送get請求 print(r.status_code)

hive的常用操作

文件夾 char external list 正常 ted format ont light 1、hive的數據類型 tinyint/smallint/int/bigint tinyint:從 0 到 255 的整型數據 smallint:從 0 到 65535 的整型數

Hive 修改表結構常用操作

新增列 add columns 　　　　alter table table_name add columns (id int comment '主鍵ID' ) ; 　　　　預設在表所有欄位之後，分割槽欄位之前。替換列 replace columns ,會替換所有列

Hive-常用操作

前提條件：安裝好hadoop2.7.3（LInux系統下）安裝好hive2.3.3（Linux系統下）安裝好Xampp（Windows系統下），併成功用Navicat連線Xampp Mysql。參考：Navicat連線Xampp資料庫準備源資料： 1.

hive中常用操作

本篇文章主要介紹一下hive的常用sql 操作新增分割槽一次新增一個分割槽 ALTER TABLE table_name ADD PARTITION (partCol = 'value1') location 'loc1'; //示例 ALTER T

HIVE分割槽常用操作

分割槽常用操作 1.檢視分割槽表中有哪些分割槽 show partitions table_name; SHOW PARTITIONS tomcat_log PARTITION(year='2019'); 2.查詢某個分割槽下的資料根據分割槽查詢資料 select tabl

hive-常用操作及函式

select '我們' from file_cto_user_info limit 1 select 1 from file_cto_user_info where 'football' like 'foot____' limit 1 --注意：否定比較時候用NOT A L

HIVE的常用操作-建庫和表-插入資料

hive的安裝（遠端模式）點選開啟連結使用hive ----------------------- 啟動hadoop 啟動hive 建立資料庫： create database myhive; 檢視資料庫： hive (default)> s

Hive 常用操作

hive> SELECT age,grade FROM student1;OK22 大三23 大二22大三24大四23大三Time taken: 0.072 seconds, Fetched: 5 row(s)hive> SELECT DISTINCT age,grade FROM student

二.Hive數據庫的安裝

hive======一.Hive數據庫的安裝======<code>1.首先需要安裝以上hadoop環境。2.安裝mysql環境存儲Hive的元數據，因為默認的元數據是存放在derby（只支持一個鏈接，用於測試）實際環境用mysql。3.安裝環境使用centos 6.5 IP為：192.168.

javascript的常用操作(二)

var IT script func 檢測用法 def 需要 urn Undefined 不是 Null 在 JavaScript 中, null 用於對象, undefined 用於變量，屬性和方法。對象只有被定義才有可能為 null，否則為 undefined。如

Hive學習之路（十）Hive的高級操作

ipc functions nes aof inpu 輸入表格開發 eat 一、負責數據類型 1、array 現有數據如下： 1 huangbo guangzhou,xianggang,shenzhen a1:30,a2:20,a3:100 beijing,

1 數據結構(13)_二叉樹的概念及常用操作實現

做什麽 != 後繼 switch 繼承 mem bad 葉子 static 1. 樹到二叉樹的轉換思考：通用樹結構的實現太過復雜（樹中每個結點都可以有任意多的孩子，具有多種形態），工程中很少會用到如此復雜的樹是否可以簡化呢？思路：減少樹結點中孩子的數量。但這樣樹是否還能通

Hive當中實現pivot操作

0.背景實際工作當中遇到這樣一個問題，資料如下，但是我想通過SQL將資料轉換成按列展示的形式，即常用的pivot透視操作。 # 原始資料 id item value 1 a 10 2 b 21 1 b 15 2 a 20 # 次級目標格式（S

MySQL資料庫常用操作命令二

接上一篇的操作： 1.查詢相反條件：select 查詢欄位 from 表名 where not (查詢條件); 2.範圍查詢:

python學習（二）List語法基礎與常用操作

- list 是列表，也叫陣列，用[ ]括號，並用逗號隔開，裡面可以任意型別，字串，數字，都可以。** 取值用 list[角標]，開始從0開始，如：list2=[1,2,”字串”]，如果取list[2],那麼就是：字串 list的增加資料的操作 1、lis

HIVE安裝和基本操作

一、安裝HIVE 1、在本地檔案系統中找到hadoop所在目錄，開啟命令終端，如圖： 2、通過命令終端進入到hadoop所在資料夾，並通過命令ls 檢視bin檔案下所有命令，如圖： 3、執行啟動命令start-all.sh啟動hadoop，並用jps命令檢視所有程序是否成功啟動，如

Java中Arrays.toString ()列印二維陣列及Array陣列的常用操作

1.Java中Arrays.toString () 已知列印一維陣列的API為System.out.println ( Arrays.toString ();，其引數為陣列名或陣列指標，其支援的資料型別有很多，如：int[]、char[]、byte[]等。 import java

hive (二) ----- hive的常用操作

相關推薦