Hadoop第八講

阿新 • • 發佈：2018-12-29

Pig Latin

子專案致力於降低hadoop的複雜性。Pig可以看做是hadoop的客戶端軟體，可以連線到hadoop叢集進行資料分析工作。Pig方便不熟悉Java的使用者，使用一種較為簡便的類似SQL的面向資料流的語言pig latin進行資料處理。Pig latin可以進行排序，過濾，求和，分組，關聯等操作，還可以自定義函式，這是一種面向資料分析處理的輕量級指令碼語言.

Pig可以看做是pig latin到map-reduce的對映器。

語言用起來不是很好理解，在社群中使用的不是太廣泛，一般使用Hive的較多。

安裝：

下載並解壓pig安裝
在.bashrc中配置環境變數，注意JAVA_HOME=安裝目錄的上級目錄
進入grunt shell驗證

Pig工作模式

1. 本地模式：所有檔案和執行過程都在本地，一般用於測試

2. Mapreduce模式：實際工作模式

配置pig的map-reduce模式

設定PATH,增加PIG_CLASSPATH環境變數
修改hosts文，啟動pig
啟動pig

Pig的執行方式：指令碼(字尾是pig)、grunt、嵌入式(嵌入到java中，使用pig提供的jar即可) gruntshell命令可以通過help列舉出來。

Pig資料模型 Bag:表，Tuple：列，Field:屬性， Pig不要求同一個bag裡面的各個tuple有相同資料或相同型別的field。 Pig Latin常用語句: Load：裝入資料，FOREACH:逐行掃描進行某種處理形成另一張表。FILTER：過濾行 DUMP：把結果顯示到螢幕 STORE:把結果儲存到檔案。例子1：從氣象資料集中計算一年中的最高記錄

Hadoop第八講

Hadoop第八講

操作系統(筆試系列)-第八講文件系統

學習筆記-小甲魚Python3學習第八講：了不起的分支和循環2

第八講一階常係數線性ODE（續）

第八講：產生式模型：NaiveBayes, HMM（上）

Stanford CS224n 第八講：RNN和語言模式

第八講：8.1 spring 對JDBC支援

視覺SLAM14講-第八講筆記

Stanford機器學習第八講支援向量機SVM

讀《MySQL實戰45講》第八講總結

李巨集毅機器學習2016 第八講深度學習網路優化小訣竅

Machine Learning第八講【非監督學習】-- （四）PCA應用

Machine Learning第八講【非監督學習】--（三）主成分分析（PCA）

Machine Learning第八講【非監督學習】-- （二）動因

Machine Learning第八講[非監督學習] -- （一）聚類

八、Servlet(第八講)

ArcGIS Engine + C# 例項開發教程：第八講屬性資料表的查詢顯示

黑馬程式設計師-Oracle（第八講）

08、劉媛媛《普通人快速崛起31節修煉課》第八講個人學習筆記

Stanford機器學習---第八講. 支援向量機SVM

Hadoop第八講

相關推薦