1. 程式人生 > >hive官網翻譯之總體概述

hive官網翻譯之總體概述

Apache Hive

hive官網原文地址 https://cwiki.apache.org/confluence/display/Hive/Home;jsessionid=91AF539FA31786D88F9DCAA009B31ED9

      hive 資料倉庫使用基於分散式儲存和查詢的sql語義,能夠很方便地的讀寫,管理海量資料集。

      基於hadoop,hive有以下特性:

      1、通過sql工具能夠很容易的訪問資料,由此實現了資料倉管的功能如etl,報告,資料分析等。

      2、提供對各種資料格式結構化的一種機制。

      3、能夠訪問儲存在hdfs或hbase中的檔案。

      4、查詢引擎可以是Tez,Spark,MapReduce。

      5、過程化語言hplsql。                                                                 注:過程化語言即第三代語言c,c++,java

      6、通過Hive LLAP,YARN或者Slider進行亞秒級查詢 。

       hive提供了標準sql功能,包括許多SQL:2003和SQL:2011及以後版本的分析特性。使用者可以通過UDFs,UDAFs,UDTFs新增自己的程式碼來擴充套件hive的sql功能。

       hive支援多種資料儲存格式,自帶了用於逗號和製表符分割值的內建聯結器,可用於(csv/tsv)文字檔案,Parquet,ORC和其他格式檔案。使用者可以使用聯結器來擴充套件對其他格式檔案的支援,詳細看

File FormatsandHive SerDe       hive旨在是最大化可伸縮性(用多機器動態新增到hadoop叢集的橫向擴充套件)、效能、可擴充套件性、容錯、解耦。hive不是為OLTP(線上事務處理)設計的,最好用來處理傳統資料倉庫任務。

       hive的元件主要有HCatalog和WebHCat.

       1、HCatalog是hadoop中表和儲存的管理層,使使用者能夠用不同的工具如pig,mapreduce來處理不同的資料,在這個架構中能夠很方便的讀寫資料。

       2、WebHCat提供了這樣一種服務,讓你可以執行Hadoop的MapReduce,Pig,Hive任務,或者使用HTTP介面(Rest風格)來執行hive元資料的操作。

相關推薦

hive翻譯總體概述

Apache Hive hive官網原文地址 https://cwiki.apache.org/confluence/display/Hive/Home;jsessionid=91AF539FA31786D88F9DCAA009B31ED9       hive 資料倉庫使

翻譯RDD Programming Guide-Scala

Overview(概述) At a high level, every Spark application consists of a driver program that runs the user’s main function and executes

hadoop 閱讀 MR Support for YARN Shared Cache

Overview MapReduce 支援yarn共享快取,允許mapreduce利用額外的資源快取。 他儲存了作業提交客戶端和yarn叢集之間的網路頻寬。這會節約reduce工作的提交時間和所有工作的執行時間。 Enabling/Disabling the shared cache

寫在“喜文測試”啟動

前言 以前,測試行業的普遍看法是: 自動化測試的成本較高,介面測試還可以開展一下,UI 自動化測試的價效比很低,完全沒有必要。 這句話是對的,但也是錯的。 就比如,小程式釋出之初,大部分人都說不看好,而後小程式經過短暫的熱鬧,也就真的迅速的沉寂了將近一年之久。 但是,一年之後,當潛心打磨的新

Retrofit翻譯

Retrofit Android和Java平臺下型別安全的HTTP客戶端 寫在前面:1.如果發現問題歡迎Issue;2.有些不知道對不對的地方給出了原文;3.如果你有更好的建議歡迎Issue; Retrofit 翻譯之前 簡介

(一)我的畢業設計總體概述

        經過兩個月的開發,我的畢業設計-《校園網溝通平臺》終於基本開發完成了,感到非常高興,但由於時間緊迫,還要趕著寫論文,所以肯定存在很多bug,希望大家多給點建議,同時歡迎使用校園網的同學幫手執行測試,先謝謝了。  技術簡介:我的設計是基於SOA架構的,主要採用微

GitHub使用指南Hello World

本文是GitHub官方指南Github Guides的英文翻譯,幫助大家更好的使用。 翻譯並不是直接翻譯,而是按照中文思維翻譯。 轉載請註明出處。 Hello world 閱讀全文需時十分鐘 編寫Hello world專案是計算機程式設計領域的一個時代傳統,所以我們學習GitHub也從Hello wor

Elasticsearch使用場景翻譯: getting started

Elasticsearch is a highly scalable open-source full-text search and analytics engine. ElasticSearch 是一個高可用的,可伸縮的,開源的,全文檢索與分析的引擎

openCV人臉識別三種演算法實現(翻譯

 怎樣使用OpenCV進行人臉識別 友情提示,要看懂程式碼前,你得先知道OpenCV的安裝和配置,會用C++,用過一些OpenCV函式。基本的影象處理和矩陣知識也是需要的。[gm:我是簫鳴的註釋]由於我僅僅是翻譯,對於六級才過的我,肯定有一些翻譯錯的或

Kotlin 協程翻譯

你的第一個協程 fun main(args: Array<String>) { launch { //在後臺啟動新的協程並繼續 delay(1000L) //非阻塞延遲1秒(預設時間單位為ms) prin

bootstrap4 使用及常用樣式詳細整理 (依照翻譯)

bootstrap4使用及常用樣式整理 簡介 Bootstrap 是全球最受歡迎的前端元件庫,用於開發響應式佈局、移動裝置優先的 WEB 專案。Bootstrap4 目前是 Bootstrap 的最新版本,是一套用於 HTML、CSS 和 JS 開發的

翻譯 xa分散式事務的限制點( Restrictions on XA Transactions )

原文: http://dev.mysql.com/doc/refman/5.1/en/xa-restrictions.html D.5 Restrictions on XA Transactions  綜述:   external XA的概念.  介紹了mysql 內部XA

初識elasticsearch(翻譯

目錄 基本概念 注意 叢集健康 建立索引 更新文件 刪除文件 批量執行 查詢api 執行查詢 執行過濾器 執行聚合 Elasticsearch是一個高度可擴充套件的開源的全文搜尋和分析引擎,它

軟體工程總體概述

軟體工程也看了一段時間,在完成學生資訊管理系統和機房收費系統的基礎上,看軟體工程視訊也成了一件不是非常頭疼的一件事情了,基本上都有 共鳴,有了共鳴,自然就覺得他有意思了。 軟工視訊和其它視訊課本一樣,

Layout resource(佈局資源)-----翻譯

開發十年,就只剩下這套架構體系了! >>>   

Android View物件----翻譯

開發十年,就只剩下這套架構體系了! >>>   

翻譯】效能篇(十)效能提示

前言        本文翻譯自Android開發者官網的一篇文件,主要用於介紹app開發中效能優化的一實踐要點。        中國版官網原文地址為:https://developer.android.google.cn/tr

照著來安裝openstack pikeenvironment設置

secure 修改配置 cti es2017 http mysqld and shang miss 安裝openstack前的準備環境:   兩個centos7系統的環境:192.168.101.10 node1,192.168.101.11 node2 控制節點node1

照著來安裝openstack pikeglance安裝

for 本地 net 文件系統 reg poi glance服務 來安 rate 鏡像服務image service(glance)的安裝還是在控制節點上進行: 1、前提條件,數據庫為glance創建庫和賬戶密碼來連接數據庫 # mysql -u root -p Mar

localbitcoins部分翻譯

存儲 貨幣 strong 信息 str off 技術 窗口 區域 比特幣不是匿名的 一些努力是被要求的,想要保護你的比特幣隱私。全部的比特幣交易被存儲公共的和永久的在網絡上,那意味著任何人都能看到你比特幣地址的交易和余額。然而,一個地址之後的用戶標識依舊是未知的,直到信