Hive效能優化簡介（順便介紹了效能工具--ANALYZE）

阿新 • • 發佈：2018-11-27

ANALYZE關鍵字可以收集數值統計資訊。

加速查詢，直接從統計資訊中拿，而不會再啟動mapreduce去查詢。

用desc命令去查統計資訊。

Hive效能優化包含以下點：

partition table 這是最好的優化，比如用年月日，部門

聯合查詢，可以先按xx做分割槽，再按別的做分割槽

bucket table

經常被join連線查詢的這種column上建立bucket

這才能提高查詢效率

index

每當資料更新時，也要去更新索引，所以維護成本也不小。

實際用的比較少。

幾種好用的資料型別，

orc ,parquet等，都是基於列的，所以查詢效能非常高。

（資料過濾等經常用）

資料壓縮

第一，可以減少很多空間。

第二，資料shuffle過程中傳輸速度也會變快。

但是壓縮了也要解壓，所以也不能壓縮的太狠。

有專門的演算法叫snappy 用於快速壓縮，壓縮比適中。

data localization

處理引擎放到另一個叢集。。。

資料和演算法儘量不分離，

比如說我hadoop我把三個拷貝增加到六個拷貝。

（這點不太懂）

Avoid small files

為什麼使用動態分割槽會對叢集產生不好的影響（產生小檔案）？（間接問法）

避免存放太多小檔案，原因如下：

1. 因為每個檔案都會產生元資料存在namenode的記憶體。

namenode資源被過多消耗，效能會受到很大影響。

2. 因為block size是比較大的，檔案雖然小，但是小檔案增大後佔的blocksize會越來越多。

解決方法：

1.多進行合併，有一些自動合併功能。沒有用hive時，寫第三方mapreduce job來合併。

2.多生成大檔案的資料來源再發給hadoop

Hive

可以用TEZ engine來代替mapreduce，它本質是mapreduce的最佳實踐。

效能很高。

使用Hive LLAP

Hive2.0後 LLAP優化，在後臺啟動一個長久的執行緒，不會為每次查詢再啟動。

資料通過快取來獲得，而不是所有結果都直接去查詢。

Hive transaction

不必要就不要建立事務，

很消耗資源

除非你有特殊需求。

Hive效能優化簡介（順便介紹了效能工具--ANALYZE）

ANALYZE關鍵字可以收集數值統計資訊。加速查詢，直接從統計資訊中拿，而不會再啟動mapreduce去查詢。用desc命令去查統計資訊。 Hive效能優化包含以下點： partition table 這是最好的優化，比如用年月日，部門

35 個 Java 程式碼效能優化總結（一）

前言程式碼優化，一個很重要的課題。可能有些人覺得沒用，一些細小的地方有什麼好修改的，改與不改對於程式碼的執行效率有什麼影響呢？這個問題我是這麼考慮的，就像大海里面的鯨魚一樣，它吃一條小蝦米有用嗎？沒用，但是，吃的小蝦米一多之後，鯨魚就被餵飽了。程式碼優化也是一樣，如果專案著眼於儘快無BUG

論效能優化措施（JAVA）

一前端效能優化 1.頁面的HTTP請求數量 2.使用CDN網路 3.是否使用壓縮，對於前段樣式檔案與指令碼檔案，可將其中空格、註釋等不必要的字元去掉，並且通過使用gzip壓縮來減少網路上傳輸的位元組數。二 java程式優化 1.使用單例，如餓漢 2.futur

35 個 Java 程式碼效能優化總結（複製於碼農網）

Android效能優化典範（二）

來源 http://www.csdn.net/article/2015-04-29/2824583-android-performance-patterns-season-2/4 Google前幾天剛釋出了Android效能優化典範第2季的課程，一共20個短視訊，包括的內

Android效能優化筆記（一）——啟動優化

參考文章： https://time.geekbang.org/column/article/73651 https://mp.weixin.qq.com/s/eaArt5Udc4WZ3NoH5RlEkQ https://juejin.im/post/5874bff0128fe1006b4

技術分享：Java效能優化實踐（附效能優化專題思維導圖）

Java 應用效能優化是一個老生常談的話題，筆者根據個人經驗，將 Java 效能優化分為 4 個層級：應用層、資料庫層、框架層、JVM 層。通過介紹 Java 效能診斷工具和思路，給出搜狗商業平臺的效能優化案例以供參考。 Java 應用效能優化是一個老生常談的話題，典型的效能問題如頁面響應慢、介

如何做Go的效能優化？（轉）

Go的效能優化其實總的來說和C／C++等這些都差不多，但也有它自己獨有的排查方法和陷阱，這些都來源於它的語言特性和環境。 1.效能優化前提——任何好的東西都是在正確的前提上程式碼界的很多事是和我們生活的哲學息息相關的，我們想要做好一件事，首先要保證我們能按時完成我們的任務，其次再去想如何把工作做的更好。

程式效能優化探討（5）——快取記憶體、儲存器山與矩陣乘法優化

這一節內容將綜合（3）和（4），討論快取記憶體相關的程式優化。一、牛B完了的儲存器山一個程式從儲存系統中讀資料的速率被稱為讀吞吐量或讀頻寬。如果一個程式在s秒的時間段內讀n個位元組，那麼讀吞吐量就是n/s，一般用MB/s作為單位。

Java 程式碼效能優化總結（過來人經驗）

Java 程式碼效能優化總結（過來人經驗）程式設計師界的彭于晏 2018-10-10 18:11:54 代碼優化，一個很重要的課題。可能有些人覺得沒用，一些細小的地方有什麼好修改的，改與不改對於程式碼的執行效率有什麼影響呢？這個問題我是這麼考慮的，就像大海里面的鯨魚一樣，它吃

前端效能優化總結（三）

常用的優化有兩部分第一：面向內容的優化 1. 減少 HTTP 請求 2. 減少 DNS 查詢 3. 避免重定向 4. 使用 Ajax 快取 5. 延遲載入元件 6. 預先載入元件 7. 減少 DOM 元素數量 8. 切分元件到多個域 9. 最小化 iframe

程式效能優化探討（3）——儲存器層次結構與快取記憶體

連外行都大概清楚，目前硬體速度的瓶頸在硬碟而不是CPU。為了有效的克服不同器件之間的速度差，從CPU到硬碟引入了多級快取機制。由於快取影響程式讀取速度，因此是實現優化時必須考慮的內容。一、儲存器層次結構快取的思想可能存在於任何有速度差的

諾信EFD釋出的全新“優化點膠”視訊介紹了活塞如何改善工藝控制

視訊有助於製造商瞭解活塞選型如何影響流體點膠效果，並防止跳塞現象的產生羅得島東普羅維登斯--(美國商業資訊)--諾信(NASDAQ: NDSN)旗下公司、世界領先的精密流體點膠系統製造商諾信EFD推出全新的Better Dispensing 優化點膠操作系列視訊。這四段具有高度指導意

Hbase叢集運維及應用效能優化總結（hbase1.20+）

（一）. 作業系統 1. 足夠大的記憶體 2. 作業系統64位，jdk64位 3. 設定li

LeakCanary 記憶體洩漏監測效能優化簡介原理 MD

Markdown版本筆記我的GitHub首頁我的部落格我的微信我的郵箱目錄簡單使用 A memory leak detection 記憶體洩露檢測 library for Android and Java. A small leak

Android 效能優化典範（六）

這裡是Android效能優化典範第 6 季的課程學習筆記，從被@知會到有連載更新，這篇學習筆記就一直被惦記著。現在學習記錄分享一下，請多多指教包涵！這次一共才 6 個小段落，涉及的內容主要有程式啟動時間效能優化的三個方面：優化 activity 的建立過程，優化 App

Android效能優化典範（三）

Android效能優化典範的課程最近更新到第三季了，這次一共12個短視訊課程，包括的內容大致有：更高效的ArrayMap容器，使用Android系統提供的特殊容器來避免自動裝箱，避免使用列舉型別，注意onLowMemory與onTrimMemory的回撥，避免記憶體洩漏，

程式效能優化探討（4）——直接對映快取記憶體命中率問題的模擬

前一節初步介紹了快取記憶體的結構和地址劃分策略，以及快取記憶體“讀”處理規則，這一節從討論“寫”開始。一、快取記憶體寫的處理快取處理讀的過程是，根據編號查詢相應的值，如果不命中，就從下一集快取調入新的資料，再根據替換策略（不細數），將新

Android效能優化篇（一）——佈局優化

Android效能優化篇題記：不知道別人是怎麼學習的，我總是覺得我學習的效率很低，昨天發生了不愉快的事情後，我痛定思痛，反思了一下自己，還是總結不夠，也是工作中接觸的東西

MySQL 資料庫效能優化之（三）索引優化

大家都知道索引對於資料訪問的效能有非常關鍵的作用，都知道索引可以提高資料訪問效率。為什麼索引能提高資料訪問效能？他會不會有“副作用”？是不是索引建立越多，效能就越好？到底該如何設計索引，才能最大限度的發揮其效能？這篇文章主要是帶著上面這幾個問題來做一個簡要的分析，

Hive效能優化簡介 （順便介紹了效能工具--ANALYZE）

相關推薦

Hive效能優化簡介（順便介紹了效能工具--ANALYZE）