做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(一)

阿新 • • 發佈：2020-11-16

我們要做的事情大概分3步：

1、需求的描述（主要把問題點丟擲來）

2、解決如何優化sql效能的問題（hive關於一條sql的生命週期原始碼的分析），也就是如何對你的sql進行RBO和CBO的優化

3、解決如何自動識別sql元資料的問題（antlr關於如何深度優先遍歷語法樹）

背景：

我們有一套智慧中臺系統，可以基於配置化的方式就可以做出各種圖表。說白了就是可以快速給業務通過圖表的方式展現資料

需求：

通過配置來快速展現資料固然是好的事情，但稍微思考一下其實也是通過配置的方式來生成sql；
那麼生成的這個sql效能不見得會很好吧？（其實會非常的不好）

比如，我們通過配置的方式生成的sql大概這個樣子：

select 
  t0.tree_id, 
  sum(t0.gap) as num 
from 
  (
    SELECT 
      w.tree_id, 
      w.gap, 
      r.executed_sql 
    FROM 
      data_middleground.view_mkt_node_kpi_warning w 
      JOIN data_middleground.view_mkt_node_result r ON w.tree_id = r.tree_id 
    WHERE 
      w.warning_status = 0 
      and r.is_del = 0
  ) t0 
where 
  t0.gap > 1 
group by 
  t0.tree_id 
order by 
  tree_id desc

花一分鐘仔細看下這個sql，會發現其實很爛，效能點在：

1、表關聯的時候，謂詞沒有下推
2、多個謂詞分別出現在關聯和聚合的地方，沒有做過濾合併和下推
3、有聚合操作，是否可以聚合下推？

爛sql的執行計劃：

LogicalSort(sort0=[$0], dir0=[DESC])
  LogicalAggregate(group=[{0}], num=[SUM($1)])
    LogicalProject(tree_id=[$0], gap=[$1])
      LogicalFilter(condition=[>($1, 1)])
        LogicalProject(tree_id=[$0], gap=[$1], executed_sql=[$4])
          LogicalFilter(condition=[AND(=($2, 0), =($5, 0))])
            LogicalJoin(condition=[=($0, $3)], joinType=[inner])
              EnumerableTableScan(table=[[data_middleground, view_mkt_node_kpi_warning]])
              EnumerableTableScan(table=[[data_middleground, view_mkt_node_result]])

那麼能否通過一套程式碼處理後，讓“爛sql1”進入程式碼，出來後是“好sql2”

先看下成果，優化後的sql：

SELECT 
  `t0`.`tree_id`, 
  SUM(`t0`.`gap`) AS `num` 
FROM 
  (
    SELECT 
      * 
    FROM 
      `data_middleground`.`view_mkt_node_result` 
    WHERE 
      `is_del` = 0
  ) AS `t` 
  INNER JOIN (
    SELECT 
      * 
    FROM 
      `data_middleground`.`view_mkt_node_kpi_warning` 
    WHERE 
      `warning_status` = 0 
      AND `gap` > 1
  ) AS `t0` ON `t`.`tree_id` = `t0`.`tree_id` 
GROUP BY 
  `t0`.`tree_id` 
ORDER BY 
  `t0`.`tree_id` IS NULL DESC, 
  `t0`.`tree_id` DESC

請花一分鐘看下sql，會發現這真TM是個好的sql;

執行計劃：

LogicalSort(sort0=[$0], dir0=[DESC])
  LogicalAggregate(group=[{0}], num=[SUM($1)])
    LogicalProject(tree_id=[$0], gap=[$1])
      LogicalProject(tree_id=[$0], gap=[$1], executed_sql=[$4])
        LogicalJoin(condition=[=($0, $3)], joinType=[inner])
          LogicalFilter(condition=[AND(=($2, 0), >($1, 1))])
            EnumerableTableScan(table=[[data_middleground, view_mkt_node_kpi_warning]])
          LogicalFilter(condition=[=($2, 0)])
            EnumerableTableScan(table=[[data_middleground, view_mkt_node_result]])

那麼如何實現上面的功能呢？可以參考spark、hive、druid等，他們是如何做的sql優化。這裡我參考的是hive；

那麼接下來通過走讀hive原始碼的方式來看下，hive是如何處理一條sql的【請看下一篇：做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(二)】

做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(一)

我們要做的事情大概分3步： 1、需求的描述（主要把問題點丟擲來） 2、解決如何優化sql效能的問題（hive關於一條sql的生命週期原始碼的分析），也就是如何對你的sql進行RBO和CBO的優化

做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(二)

上一篇：做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(一)

Redmi 遊戲手機入網，搭載聯發科天璣 1200 晶片，代號 ares

3 月 31 日訊息數碼博主 @數碼閒聊站今天透露，Redmi 遊戲手機現已入網，搭載聯發科天璣 1200 晶片，型號為 M2104K10C，研發代號 ares。

榮耀 Magic3/Pro 手機發布 Magic UI 5.0.0.116 系統更新：優化相機，預置“暢連”通話應用

8 月 16 日訊息據網友反饋，剛剛釋出的榮耀 Magic3/Pro 手機雖然還未正式上市開售，但已經迎來了 Magic UI 5.0.0.116 系統更新，大小 804MB 左右，本次更新優化相機的拍照效果，新增預置“暢連”應用，增強了穩定性

“員工暴力分揀，建議客戶發順豐”上熱搜，申通迴應：開除言論不當人員、處罰承包區

12 月 19 日訊息，今日，“申通建議客戶發順豐”衝上微博熱搜。瞭解到，該熱搜的起因是一則申通快遞員工暴力分揀的視訊在網上流傳。並且，網點一位工作人員迴應稱，客戶發東西怕摔，建議以後發順豐。該回應進一步引

觸控板手勢增強器Multitouch，讓你的Mac觸控板更加完美，手勢更加豐富！

很多人喜歡使用 Mac觸控板的原因是，它提供了實用的手勢來提高操作效率：兩指捏合實現放大或縮小，兩指滑動輕掃，還有四指向上檢視排程中心等等。我相信你對這些手勢的運用都已經得心應手，但你有沒有想過，Mac觸控板

在面試時用php+swoole編寫了一個簡易聊天室，面試官讓我明天來上班！

Swoole：面向生產環境的 PHP 非同步網路通訊引擎使 PHP 開發人員可以編寫高效能的非同步併發 TCP、UDP、Unix Socket、HTTP，WebSocket 服務。Swoole 可以廣泛應用於網際網路、行動通訊、企業軟體、雲端計算、網路

搭建一個強大的資料平臺，讓你的資料分析事半功倍！

有效企業資料戰略的核心是資料管理。在分析一家企業所擁有的資料之前，必須先了解它是如何儲存資料的。而體量龐大且種類繁多的資料積累則可能使企業在原始資料的管理面前望而卻步。

Doinb發視訊自嘲比賽失利：卡爾瑪順風讓對手噁心，逆風是讓隊友噁心！

LPL季後賽第5場的BO5，TES勢如破竹的零封擊敗了LNG，這一結果是很多人意料之外的，因為兩者皆是頭部隊伍，這樣的強強對決竟然被單方面的碾壓了，而在開賽前雖然解說大部分都看好TES贏，但如此摧枯拉朽確實是大家沒想

結合實際需求，在webapi內利用WebSocket建立單向的訊息推送平臺，讓A頁面和服務端建立WebSocket連線，讓其他頁面可以及時給A頁面推送訊息

1.需求示意圖 2.需求描述原本是為了給做unity3d客戶端開發的同事提供不定時的訊息推送，比如商城購買道具後服務端將道具資訊推送給客戶端。

這幾個程式設計小技巧，讓你程式碼效率提高一個檔次java

for迴圈 for迴圈變數初始化在c語言中，我們常常這樣使用for語句： for (int i = 0; i < strlen(s); i++)

Python寫一個物件，讓它自己能夠迭代

仿寫range()物件，物件是可迭代的： 1 #!usr/bin/env python3 2 # -*- coding=utf-8 -*- 3 4 class myRange():

玉兔二號發來中秋祝福，還公佈了一項發現

10 月 1 日訊息剛剛，月球車 “玉兔二號”在官方微博上送出中秋祝福。還畫了一張 “玉兔二號”和 “玉兔號”“兩隻兔”在這塊月亮上蹦躂的圖。

NO.111 禪道匯出資料做透視表，讓你輕鬆做年終工作總結。

>>> 年底了，很多公司都要求大家寫年終工作總結。估計很多童鞋就開始犯愁了。年年寫，來來去去總是那些模式，自己都覺得沒意思。

秋招必備！阿里產出的高併發+JVM套餐，讓offer隨手就來

有訊息稱，位元組跳動將持續大規模招聘，今年全年校招崗位需求將超過1.2萬人。在Boss上，位元組系正在招聘的崗位數量也超過了1萬個。

老闆讓只懂Java基本語法的我，基於AQS實現一個鎖

10 點整，我到了公司，又成為全組最後一個到的員工。正準備刷刷手機摸摸魚，看見老闆神祕兮兮地走了過來。

使用 Element UI Select 元件的 value-key 屬性，讓繫結值可以為一個物件

EsunR2019-11-07 12:14:4212264收藏6 分類專欄：Vue文章標籤：element-ui 版權當我們使用 Elemet UI 的選擇元件進行多選時，Select 元件的繫結值是一個數組，但是陣列的值只能傳入 Number 型別或者

給定一個由N個非負整數構成的序列，我們來定義一下序列的中位數，如果N是奇數，在對序列排序後，中位數就是最中間的那個數，即排序後，中位數的位置為(N+1)/2，這裡序列的位置從1開始。如果N是偶數，則中

技術標籤：c語言 Problem Description 給定一個由N個非負整數構成的序列，我們來定義一下序列的中位數，如果N是奇數，在對序列排序後，中位數就是最中間的那個數，即排序後，中位數的位置為(N+1)/2，這裡序列的位

想做Windows平臺高階工程師，卻連視窗原理都不懂，朋友都勸我放棄~

1、Windows程式開發流程： Windows 程式分為「程式程式碼」和「UI資源」兩大部分，通過RC編譯器整合為一個完整的EXE 檔案。

css中使用unicode和偽類，不使用圖片來做箭頭

技術標籤：筆記使用偽類搭配unicode來實現箭頭，可以免去一些常見圖片的載入，做起來也很方便

做一個平臺，讓對手發來一個很爛的sql，然後系統返回一個優化好的sql(一)

相關推薦