誰的速度快！誰背鍋（技術解析）

阿新 • • 發佈：2020-12-04

溫馨提示：如果你沒有相關的從業經驗，本文將會非常晦澀。

深夜，領導： “你寫的介面有問題！趕緊起床瞧瞧”。

Ding！催命軟體一響，你就知道，該work了。

可思來想去，覺得不可能啊。我的程式碼，就是一個簡單的redis查詢啊，難不成是Redis掛了？

同事把證據全部發到了群裡，是你的介面無疑。一個簡單的Get查詢，平均耗時達到了2秒。jstack，promethus的監控，把問題全部指向到了你的介面！

登入Redis伺服器，一切正常。該怎麼辦？要這麼不明不白不清不楚的背個章丘大鐵鍋麼？

1. 快是原罪

這種情況下，要相信自己的直覺。你的介面又快又好，很可能是木秀於林，鶴立雞群，當了替罪鳥。

在 “某些” "高併發"環境下，由於資源未做隔離，在發生問題的時候，一些日誌和工具的表現，會有非常強的迷惑性。

發生問題的，都是速度最快、請求最多的介面，但理論上並不可能。

如上圖。這種情況很常見。

大多數請求，通過Tomcat執行緒池的排程，進行真正的業務處理。當然執行緒池是不幹這種髒活的，它把請求交給資源處理池去處理，比如：

一個數據庫連線池，執行耗時的統計操作和迅速的查詢操作
一個Redis連線池，執行阻塞性的慢查詢和簡單的GET SET
一個Http連線池（HTTPClient、OkHTTP等），遠端呼叫速度不等的資源

我們平常的編碼中，通常都會共用這樣的資源池。因為它寫起程式碼來簡單，不需要動腦。

但如果你的服務本身，並沒有做好拆分以及隔離，問題就是致命的。比如，你把報表介面和高併發的C端介面放在了一個例項上。

這時候，你就有可能被報表介面給坑了。

2. 一個例子

我們以資料庫連線池為例，來說明一下這個過程，先看一下以下基礎資訊：

Tomcat的連線池，配置大小為200個
MySQL的連線池，配置大小為50個，算是比較大了
介面A需要呼叫耗時的查詢，耗時為5秒
介面B速度非常快，查詢資料庫響應時間在200ms以下

速度快的B介面，請求量是遠遠大於介面A的，平常情況下相安無事。

有一天，介面A忽然有了大量的查詢，由於它的耗時比較長，迅速把資料庫的50個連線池給佔滿了（介面B由於響應快，持有時間短，慢慢連線會被A吃掉）。

這時候，無論是介面A，還是介面B的請求，都需要等待至少5秒鐘，才能獲取下一條資料庫連線，業務才能正常走下去。

不一小會兒，服務的狀態就變成這樣：

資料庫連線池50個連線，迅速佔滿，而且幾乎全被慢查詢佔滿
Tomcat連線池的200個連線，迅速被佔滿，其中大部分是速度快的介面B，因為它的請求量大速度快
所有介面都Block在Tomcat的執行緒上。進而造成：哪怕是查詢一個非資料庫的請求，也要等待5秒左右

一般在遇到這種問題的時候，我們都傾向於使用jstack列印資訊堆疊，或者檢視一些內部的監控曲線。可惜的是，這些資訊，大部分都是騙人的，你看到的慢查詢，並不是真正的慢查詢。

從xjjdog上面的分析中，你應該很容易看出問題的癥結所在：未隔離的瓶頸資源引起上游資源的連鎖反應。

但在平常的工作中，xjjdog不止一次看到有同學對此手忙腳亂。很多證據都指向了一些又快又好的介面，而這些根本和它們一點關係都沒有。

他們樂呵呵的截圖，@相關人等，囂張至極。

在遇到這種情況的時候，你可以使用下面的指令碼進行初步分析：

$ cat 10271.tdump| grep "waiting to lock " | awk '{print $5}' | sort | uniq -c | sort -k1 -r

26 <0x0000000782e1b590>
  18 <0x0000000787b00448>
  16 <0x0000000787b38128>
  10 <0x0000000787b14558>
複製程式碼

上面的例子，我們找到給0x0000000782e1b590上鎖的執行棧，可以發現全部是卡在HttpClient的讀操作上了。在實際場景中，可以看下排行比較靠前的幾個鎖地址，找一下共性。

而這些顯示資訊非常少的堆疊，才是問題的根本原因。

3. 如何解決

增加Tomcat連線池的大小，或者增加連線池的大小，並不能解決問題，大概率還會復現。

最好的解決方式，當然是把耗時的服務和正常的服務拆分開來，比如時下流行的微服務。你的服務查詢慢，自己訪問超時，和我的服務，一丁點兒關係都沒有。

但是，你的服務即然能遇到這種問題，就證明你的公司缺乏這種改造的條件。就只能在單體服務上來做文章。

這種做法，就是隔離。

如上圖，我們在同一個工程裡，建立了兩個MySQL資料庫連線池，指向了相同的MySQL地址。使用這種方式，連線池的操作，就能夠相對做到互不影響。

但到現在為止，還沒完，因為你的Tomcat連線池依然是共享的。

慢查詢相關的，從連線池中獲取連線的策略，要改一下，不能一直等待，而應該採用FailFast的方式（獲取連線短時間的超時也是可以的），否則症狀還是一樣。

時下流行的熔斷概念，也在一定程度上實踐這種隔離性。

End

我們還可以聯想到類似的場景：

JVM發生STW，停頓期間，受影響最大的，就是那些又快請求又大的介面。而那些耗時介面，由於平常就是那個鳥樣，倒沒人關注它的異常情況。

一堆介面連線了同一個資料庫，當資料庫發生抖動，受影響最大的，依然是那些又快請求又大的介面。因為那些耗時的慢查詢，一直就是那樣表現的，沒人會懷疑到它們身上來。

殊不知，只要這些爛介面請求量一上升，就會像一顆老鼠屎，壞了整鍋湯，所有的請求都會被拖累。

這有點類似於我們平常的工作：低效的人一增多，就會拖累整個專案的進度。領導一直在納悶，為什麼那麼多技術好手，效率那麼低呢？

這是因為，他們被拖累了。過於關注個體，最根本性的問題卻掩蓋在表象之下。

公司內部的研發，從來不應該一視同仁。不同技術追求的員工，也應該做到類似的隔離，寧缺毋濫。

好手組成的團隊，交流順暢，目標一致，效率奇高；而那些擅長拖慢專案的員工，就應該放在低效的團隊，將加班進行到底。

說了這麼多，問題的關鍵就在於：並不是每一個人都能瞭解這個規律，很少有人會關注這背後的根本原因。你要給領導解釋你的介面沒有問題，需要花費很大的力氣。

“老闆，我找到原因了。是因為一個MySQL慢查詢，把Tomcat的連線池佔滿了，造成了Redis對應的Http請求響應慢。”這樣錯綜複雜的關係，真的讓人很頭痛。

“很好”，領導說，“這個問題，就有你牽頭來解決一下吧”。

你瞧，做領導的，大多不會關注問題產生的原因，他只關注誰能解決這個問題，哪怕不是你的問題。誰讓你程式碼寫得好，需求又做的快呢！

作者：小姐姐味道
連結：https://juejin.cn/post/6901541220661936136

誰的速度快！誰背鍋（技術解析）

溫馨提示：如果你沒有相關的從業經驗，本文將會非常晦澀。深夜，領導： “你寫的介面有問題！趕緊起床瞧瞧”。

iPhone 好伴侶：小米官方 20W 快充套餐 79 元（MFi 認證）

小米 20W Type-C 轉 lighting 線充套裝日常售價 89 元，今日16:00 將開啟 79 元秒殺，需運費券：京東小米 C2L iPhone 快充套裝 20W16 點 79 元秒殺直達連結Mfi 官方認證，小巧便攜。

立訊精密生產：iFory iPhone 快充線 16 元（MFI 認證）

【活動僅限 11 日 00:00~01:00，現可領券】蘋果 MFI 認證，iForylightning 編織線 0.9m 報價 56.9 元，11 月 11 日 00:00~01:00 將降至 24.95 元，下單第二件 7.5 折，疊加限量 5 元券，2 件實付 32.43 元（16.2 元/

助力邯鋼工業 4.0！TDengine 在深度（平潭）節水減排專案中的應用

從Kafka+Strom+HDFS組合到TDengine。作者｜吳明敏，深度（平潭）科技小T導讀：深度（平潭）科技有限公司是一家 IT 綜合服務提供商，致力於以工業物聯網、大資料、雲端計算、移動互聯為基礎進行行業軟體研發、

【Coel.解題報告】【阿霍-柯拉西克自動機！】AC自動機（簡單版）

AC自動機~~當然這位並不能讓你自動做題（嗚嗚嗚）今天在鴿子大佬的幫助之下學會了AC自動機的基本操作，在此感謝！！！

有獎調研！第四期（2021-2022）傳統行業雲原生技術落地調研——央國企篇

2020年，國務院國資委印發《關於加快推進國有企業數字化轉型工作的通知》，開啟了國有企業數字化轉型的新篇章，通知中明確提出要促進國有企業數字化、網路化、智慧化發展。包括建設基礎數字技術平臺、構建資料治理體

2020最新JVM面試避坑指南，可助你橫掃BAT，輕鬆斬獲offer（含解析）

無論你是什麼級別的Java從業者，JVM都是進階時必須邁過的坎。不管是工作還是面試中，JVM都是必考題。

cas客戶端流程詳解（原始碼解析）--單點登入

博主之前一直使用了cas客戶端進行使用者的單點登入操作，決定進行原始碼分析來看cas的整個流程，以便以後出現了問題還不知道是什麼原因導致的

使用css3在網頁中實現各種三角形樣式集合（原理解析）

大家在瀏覽web網頁的時候經常看到有各種各樣的圖形，比如圓形，正方形，長方形，三角形等，今天特意做了一個關於用CSS實現三角形的教程，那css三角形怎麼寫呢？css實現三角形的原理是什麼？

全網最詳細的深度學習經典模型RESNET解析【京東特邀專家朱利明】（bilibili視訊學習）（程式碼解析）

這是一篇學習記錄貼 1 import torch 2 import torch.nn as nn 3 from .utils import load_state_dict_from_url

jdk的安裝和配置（附帶解析）

https://blog.csdn.net/qq_42364543/article/details/99694882 安裝部分引用學姐的教程。下面是配置JDK環境變數簡單版

測試題10（答案解析）

1. MyBatis中collection和assosication區別？第一個是用來關聯實體類的，第二個是用來關聯集合的，也就是平時的一對一(assocication)，一對多(collection) 所以association是用於一對一和多對一，而collec

前端兩年月入30K，高頻面試題整理（含解析）

css相關 1.萬能居中 1.margin: 0 auto;水平2.text-align: center;水平3.行高，垂直4.表格，center,middle；水平垂直5.display:table-cell；模擬表格，all6.絕對定位，50%減自身寬高7.絕對定位，上下左右全0，ma

AI大語音（十四）——區分性訓練（深度解析）

本文來自公眾號“AI大道理” 聲學模型的訓練一般是基於極大似然準則(ML)，然而ML只考慮正確路徑的優化訓練，沒有考慮降低其他路徑的分數，因此識別效果不佳。區分性訓練目標是提高正確路徑得分的同時降低其他路徑的

AIBigKaldi（十一）| Kaldi的三音子模型訓練（上）（原始碼解析）

本文來自公眾號“AI大道理”。單音子模型的假設是一個音素的實際發音與其左右的音素無關。這個假設與實際並不符合。由於單音子模型過於簡單，識別結果不能達到最好，因此需要繼續優化升級。就此引入多音子的模型。

Go標準庫:30---net/url包（URL解析）

技術標籤：Go(標準庫)net/url包URL解析一、概述 import "net/url" url包解析URL並實現了查詢的逸碼，參見RFC 3986（https://tools.ietf.org/html/rfc3986）

2.7 HashMap面試必問（原始碼解析）

技術標籤：# 2 集合篇Javahashmap資料結構面試必問hashMapHashMap面試必問java 2.7 HashMap中的資料

分析 Jdbc、JdbcTemplate、Mybatis 原理區別（程式碼解析）

寫在前面：原始碼（可直接執行）： JdbcTemplate 實現mybatis_sql 實現參考部落格：

【分析雲】-分析雲簡介（技術角度）

一、分析雲是一個BI平臺工具　　分析雲是一個BI平臺工具，主要面向物件是中小企業開發的，易於安裝部署，基於傳統資料庫的數倉架構。故對中小企業來說，只要有個懂資料庫的人，通過一些學習，利用分析雲可以很好建

Flink Sql 之 Calcite Volcano優化器（原始碼解析）

Calcite作為大資料領域最常用的SQL解析引擎，支援Flink , hive, kylin , druid等大型專案的sql解析

誰的速度快！誰背鍋（技術解析）

1. 快是原罪

2. 一個例子

3. 如何解決

End

相關推薦