Hive專案實戰三

阿新 • • 發佈：2018-12-09

建立表

這裡總共需要建立4張表，明明只有兩個資料檔案，為什麼要建立4張表呢？因為這裡建立的表要使用orc的壓縮方式，而不使用預設的textfile的方式，orc的壓縮方式要想向表中匯入資料需要使用子查詢的方式匯入，即把從另一張表中查詢到的資料插入orc壓縮格式的表匯中，所以這裡需要四張表，兩張textfile型別的表user和video，兩張orc型別的表user_orc和video_orc

1.先建立textfile型別的表

create table user(
videoId string,
uploader string,
age int,
category array<string>,
length int,
views int,
rate float,
ratings int,
comments int,
relatedId array<string>)
row format delimited
fields terminated by "\t"
collection items terminated by "&"
stored as textfile;

create table video(
uploader string,
videos int,
friends int)
row format delimited
fields terminated by "\t"
stored as textfile;

向兩張表中匯入資料，從hdfs中匯入

load data inpath '資料檔案在hdfs中的位置' into table user;

2.建立兩張orc型別的表

create table user_orc(
videoId string,
uploader string,
age int,
category array<string>,
length int,
views int,
rate float,
ratings int,
comments int,
relatedId array<string>)
clustered by (uploader) into 8 buckets
row format delimited fields terminated by "\t"
collection items terminated by "&"
stored as orc;

create table video_orc(
uploader string,
videos int,
friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as orc;

向兩張表中匯入資料

insert into table user_orc select *from user;
insert into table video_orc select *from video;

這時候資料就載入到兩張表中了，可以進行簡單的檢視

select *from user_orc limit 10;
select *from video_orc limit 10;

Hive專案實戰三

建立表這裡總共需要建立4張表，明明只有兩個資料檔案，為什麼要建立4張表呢？因為這裡建立的表要使用orc的壓縮方式，而不使用預設的textfile的方式，orc的壓縮方式要想向表中匯入資料需要使用子查詢的方式匯入，即把從另一張表中查詢到的資料插入orc壓縮格式的表匯中，所以

Hive專案實戰二

1.資料清洗 1)資料分析在video.txt中，視訊可以有多個所屬分類,每個所屬分類用&符號分割,並且分割的兩邊有空格字元,多個相關視訊又用“\t”進行分割。為了分析資料時方便對存在多個子元素的資料進行操作,我們首先進行資料重組清洗操作。具體做法：

react專案實戰三登入註冊頁面與資料庫連線

ps：此部分（第二部分）的程式碼，提交簡介為second commit 原始碼地址需要引入依賴庫 npm install body-parser --save 接收post請求返回的引數 npm install utility --save MD5加密

React-Native 之專案實戰(三)

({rowHasChanged:(r1, r2) => r1 !== r2}), loaded:false, isModal:false }; this.data = [];

AngularJS進階(三十九)基於專案實戰解析ng啟動載入過程

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

從零開始Vue專案實戰（三）-專案結構

現在在瀏覽器中輸入http://localhost:8083，可以看到初始的“Welcome to Your Vue.js App”頁面了目錄結構 ├── README.md 專案介紹 ├── index.html 入口頁面 ├── build

安卓專案實戰之強大的網路請求框架okGo使用詳解（三）：快取的使用

相關實體類必須實現序列化介面使用快取前，必須讓涉及到快取javaBean物件實現Serializable介面，否者會報NotSerializableException。因為快取的原理是將物件序列化後直接寫入資料庫中，如果不實現Serializable介面，會導致物件無法序列化，進而無法

安卓專案實戰之Glide 3高手養成（三）：Glide的回撥與監聽

前言通過前面兩篇的講解，我們對於Glide的一些使用都有了基本瞭解，知道了使用Glide載入圖片只需要一行程式碼即可： Glide.with(this).load(url).into(imageView); 而在這一行程式碼的背後，Glide幫我們執行了成千上萬行的邏輯。

大資料專案實戰之 --- 某App管理平臺的手機app日誌分析系統（三）

一、建立hive分割槽表 ---------------------------------------------------- 1.建立資料庫 $hive> create database applogsdb; 2.建立分割槽表編寫指令碼。

【.NET Core專案實戰-統一認證平臺】第三章閘道器篇-資料庫儲存配置（1）

原文: 【.NET Core專案實戰-統一認證平臺】第三章閘道器篇-資料庫儲存配置（1）【.NET Core專案實戰-統一認證平臺】開篇及目錄索引本篇將介紹如何擴充套件Ocelot中介軟體實現自定義閘道器，並使用2種不同資料庫來演示Ocelot配置資訊儲存和動態更新功能，內容也是從實際設計出發

廖大python實戰專案第三天

為了看懂這一天的原始碼，翻了之前好多的文章才算是勉強理解了一點。什麼是orm 廖大在這本文中並沒有很詳細的介紹，那是因為之前就已經告訴過我們了。使用元類這一篇中在介紹元類的同時也介紹了一點orm。 ORM全稱“Object Relational Mapping”，即物件-關係對映，

mxgraph進階三 Web繪圖——mxGraph專案實戰精華篇

Web繪圖——mxGraph專案實戰(精華篇) 宣告本文部分內容所屬論文現已發表，請慎重對待。需求由於小論文實驗需求，需要實現根據使用者日誌提取出行為序列，然後根據行為序列生成有向圖的形式，並且連線相鄰動作的弧上

AngularJS進階三十九基於專案實戰解析ng啟動載入過程

基於專案實戰解析ng啟動載入過程前言在AngularJS專案開發過程中，自己將遇到的問題進行了整理。回過頭來總結一下angular的啟動過程。下面以實際專案為例進行簡要講解。 1.載入ng庫 &

從零開始搭建django前後端分離專案系列三（實戰之非同步任務執行）

前面已經將專案環境搭建好了，下面進入實戰環節。這裡挑選專案中涉及到的幾個重要的功能模組進行講解。 celery執行非同步任務和任務管理 Celery 是一個專注於實時處理和任務排程的分散式任務佇列。由於本專案進行資料分析的耗時比較長，所以採用非同步方式執行任務。本專案中Broker使用redis，Result

mxgraph進階(三)Web繪圖——mxGraph專案實戰(精華篇)

Web繪圖——mxGraph專案實戰(精華篇)宣告本文部分內容所屬論文現已發表，請慎重對待。需求由於小論文實驗需求，需要實現根據使用者日誌提取出行為序列，然後根據行為序列生成有向圖的形式，並且連線相鄰動作的弧上標有執行此次相鄰動作的頻次，每個動作另附有一個數據集，

應用程式框架實戰三十八:專案示例VS解決方案的建立(一)

　　進行專案開發的第一步，是創建出適合自己團隊習慣的VS解決方案，雖然我已經提供了專案示例，但畢竟是我建立的，你直接使用可能並不合適，另外你如果嘗試模仿重新建立該示例，中間可能碰到各種障礙，特別是專案間的依賴關係。　　本文的目的是幫助.Net架構初學者能順利搭建起適合自己的VS解決方案，我會在本文演示曾經

專案實戰：三、判斷有網沒網識別WIFI線上

1.判斷是不是wifi: /** * Check whether the device is connected, and if so, whether the connection * is wifi

WebService技術總結(三)：專案實戰——使用XML，dom4j，Xpath實現遠端呼叫

XML具有跨平臺性，在企業webservice開發中，經常將請求引數封裝為XML，並且返回一個XML作為結果。需求：客戶端將發票號碼，發票程式碼作為條件，呼叫服務端，查詢金額，稅額資訊客戶端請求引數xml形式： <?xml version="

【C#專案實戰】學生社團資訊管理系統（MVC三層架構）

程式碼很多，就不再此貼出。本來打算寫教程的，無奈沒有時間。參考帖子:【C#】簡單三層架構(MVC)實現學生資訊管理有視訊教程，完整程式碼，建議初學者先看這篇。學生社團資訊管理系統功能介紹: 1.實現了對資料庫的增刪查改 2.影象資訊儲存在資料庫，支援修改。 3

【無私分享：ASP.NET CORE 專案實戰（第三章）】EntityFramework下領域驅動設計的應用

這好像就是比我的多了一個“中轉層”，把我們的介面作為了一箇中轉，領域層繼承了倉儲實現業務和資料操作，這有什麼實際意義嗎？希望大家指正一下：我不理解的是，如果是按照這樣，那麼我如果要修改註冊方法，比如我要在上面方法中傳遞 eamil,name,password 的基礎上還需要傳遞手機號碼，那麼我需要修改

Hive專案實戰三

建立表

相關推薦