技術分享 | MongoDB 一次排序超過記憶體限制的排查

作者：任仲禹

本文目錄：

一、背景

1. 配置引數檢查

2. 排序欄位是否存在索引

二、測試環境模擬索引對排序的影響

1. 測試環境資訊

2. 報錯語句的執行計劃解釋 3. 建立新的組合索引進行測試

三、引申的組合索引問題

1. 查詢語句中，排序欄位 _id 使用降序

2. 查詢語句中，排序欄位 Num 和 _id 全部使用降序

四、引申的聚合查詢問題

1.Sort stage 使用記憶體排序

五、結論

1. 排序記憶體限制的問題

2. 使排序操作使用到索引

1) 為查詢語句建立合適的索引

2) 注意字首索引的使用

3.聚合查詢新增allowDiskUse選項

六、參考文獻

一、背景

某次在客戶現場處理一起APP業務中頁面訪問異常的問題，該頁面直接是返回一行行碩大的報錯程式碼，錯誤大概如下所示：

MongoDB.Driver.MongoQueryException: QueryFailure flag was Executor error: OperationFailed: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit

報錯頁面很明顯告知了問題排查的方向：

Sort operation 該頁面涉及的MongoDB查詢語句使用了排序。
more than the maximum 33554432 排序操作超過了MongoDB單個Session排序可使用的最大記憶體限制。

檢索MongoDB的日誌確實存在大量的查詢報錯，跟APP頁面報錯能夠對應上；並且日誌中排序使用的欄位為DT 和 _id ，升序排序。

涉及業務敏感字，全文會略過、改寫或使用'xxx'代替
2019-XX-XXTXX:XX:XX.XXX+0800 E QUERY [conn3644666] Plan executor error during find: FAILURE, ·········· sortPattern: {DT: 1, _id: 1 }, memUsage: 33555513, memLimit: 33554432, ·············· }
2019-XX-XXTXX:XX:XX.XXX+0800 I QUERY [conn3644666] assertion 17144 Executor error: OperationFailed: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit. ns:XXXXX query:{ $query:········ $orderby: { DT: 1, _id: 1 }, $hint: { CID: 1, CVX: 1 } }

1. 配置引數檢查

MongoDB Server中確認了對於Sort排序能夠支援的最大記憶體限制為32M。

> use admin
switched to db admin
> db.runCommand({ getParameter : 1, "internalQueryExecMaxBlockingSortBytes" : 1 } )
{ "internalQueryExecMaxBlockingSortBytes" : 33554432, "ok" : 1 }

2. 排序欄位是否存在索引

根據報錯資訊的建議，檢視官方文件的解釋：

In MongoDB, sort operations can obtain the sort order by retrieving documents based on the ordering in an index. If the query planner cannot obtain the sort order from an index, it will sort the results in memory. Sort operations that use an index often have better performance than those that do not use an index. In addition, sort operations that do not use an index will abort when they use 32 megabytes of memory.

文件中意思大概是：在排序欄位未利用到索引的情況下，若超過32M記憶體則會被Abort，語句直接返回報錯。

那麼現在方向基本可以鎖定在排序操作是否使用到索引了；檢視該集合狀態，排序欄位 DT 和 _id確實存在索引_id_、 DT_1 、 DT_1_CID_1_id_1 ，為啥還會報錯？帶著疑問我們下文在測試環境進行模擬。

> db.xxx.getIndexes()
[
·········
{
"v" : 1,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "xxx.xxx"
},
{
"v" : 1,
"key" : {
"DT" : 1
},
"name" : "DT_1",
"ns" : "xxx.xxx"
},
{
"v" : 1,
"key" : {
"DT" : 1,
"CID" : 1,
"_id" : 1
},
"name" : "DT_1_CID_1_id_1",
"ns" : "xxx.xxx"
}
···········

> db.xxx.getIndexes()
[
·········
{
"v" : 1,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "xxx.xxx"
},
{
"v" : 1,
"key" : {
"DT" : 1
},
"name" : "DT_1",
"ns" : "xxx.xxx"
},
{
"v" : 1,
"key" : {
"DT" : 1,
"CID" : 1,
"_id" : 1
},
"name" : "DT_1_CID_1_id_1",
"ns" : "xxx.xxx"
}
···········

二、測試環境模擬索引對排序的影響

1.測試環境資訊

MongoDB版本	4.0.10
MongoDB 儲存引擎	wiredTiger
資料量	1000000
測試集合名	data_test

集合資料儲存格式

> db.data_test.findOne()
{
"_id" : ObjectId("5d0872dc5f13ad3173457186"),
"Name" : "Edison",
"Num" : 195930,
"loc" : {
"type" : "Point",
"coordinates" : [
118.0222094243601,
36.610739264097646
]
}
}

集合索引資訊

> db.data_test.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "mongobench.data_test"
},
{
"v" : 2,
"key" : {
"Name" : 1
},
"name" : "Name_1",
"ns" : "mongobench.data_test"
},
{
"v" : 2,
"key" : {
"Num" : 1
},
"name" : "Num_1",
"ns" : "mongobench.data_test"
},
{
"v" : 2,
"key" : {
"Num" : 1,
"Name" : 1,
"_id" : 1
},
"name" : "Num_1_Name_1__id_1",
"ns" : "mongobench.data_test"
}
]

查詢語句

為測試方便，將業務中報錯的聚合查詢按同樣查詢邏輯修改為 Mongo Shell 中的普通 find() 查詢

2. 報錯語句的執行計劃解釋

測試查詢報錯的語句，嘗試檢視其查詢計劃如下：

> db.data_test.find({'Num':{"$gt":500000}}).sort({"Num":1,"_id":1}).explain()
2019-06-19T18:21:14.745+0800 E QUERY [js] Error: explain failed: {
"ok" : 0,
"errmsg" : "Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.",
"code" : 96,
"codeName" : "OperationFailed"
}

直接報錯，這裡有個疑問為啥連執行計劃都看不了？先不急，我們先刪除對於排序欄位的組合索引 Num_1_Name_1_id_1 後，再檢視執行計劃：

> db.data_test.dropIndex('Num_1_Name_1__id_1')
{ "nIndexesWas" : 4, "ok" : 1 }
db.data_test.find({'Num':{"$gt":500000}}).sort({"Num":1,"_id":1}).explain('executionStats')
{
"queryPlanner" : {
"plannerVersion" : 1,
"namespace" : "mongobench.data_test",
"indexFilterSet" : false,
"parsedQuery" : {
"Num" : {
"$gt" : 500000
}
},
"winningPlan" : {
"stage" : "SORT",
"sortPattern" : {
"Num" : 1,
"_id" : 1
},
"inputStage" : {
"stage" : "SORT_KEY_GENERATOR",
·······
"rejectedPlans" : [ ]
},
"executionStats" : {
"executionSuccess" : false,
"errorMessage" : "Exec error resulting in state FAILURE :: caused by :: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.",
"errorCode" : 96,
"nReturned" : 0,
"executionTimeMillis" : 1504,
"totalKeysExamined" : 275037,
"totalDocsExamined" : 275037,
"executionStages" : {
"stage" : "SORT",
"nReturned" : 0,
"executionTimeMillisEstimate" : 188,
····
"memUsage" : 33554514,
"memLimit" : 33554432,
"inputStage" : {
"stage" : "SORT_KEY_GENERATOR",
"nReturned" : 275037,
·····

查詢計劃中關鍵引數的解釋：

1. queryPlanner：explain中三種模式之一，預設模式。表示不會執行查詢語句而是選出最優的查詢計劃即winning plan，剩餘兩種模式分別是 executionStats 和 allPlansExecution

winningPlan：MongoDB優化器選擇的最優執行計劃

[1]stage：包括COLLSCAN 全表掃描、IXSCAN 索引掃描、FETCH 根據索引去檢索指定文件、SORT 在記憶體中進行排序（未使用索引）

[2]sortPattern：需排序的欄位

[3]inputStage：winningPlan.stage的子階段

rejectedPlans：優化器棄用的執行計劃

2. executionStats：返回執行結果的狀態，如語句成功或失敗等

executionSuccess：語句執行是否成功
errorMessage：錯誤資訊
nReturned：返回的記錄數
totalKeysExamined：索引掃描總行數
totalDocsExamined：文件掃描總行數
memUsage：Sort 使用記憶體排序操作使用的記憶體大小
memLimit：MongoDB 內部限制Sort操作的最大記憶體

上述執行計劃表明查詢語句在未使用索引排序的情況下如果排序使用的記憶體超過32M必定會報錯，那麼為什麼沒有使用到索引排序，是不是跟組合索引的順序有關？

3. 建立新的組合索引進行測試

直接建立 Num 和 _id 列都為升序的組合索引，再次檢視執行計劃：

> db.data_test.ensureIndex({Num:1,_id:1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 3,
"numIndexesAfter" : 4,
"ok" : 1
}
> db.data_test.find({'Num':{"$gt":500000}}).sort({"Num":1,"_id":1}).explain('executionStats')
{
"queryPlanner" : {
"plannerVersion" : 1,
"namespace" : "mongobench.data_test",
"indexFilterSet" : false,
"parsedQuery" : {
"Num" : {
"$gt" : 500000
}
},
"winningPlan" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"Num" : 1,
"_id" : 1
},
"indexName" : "Num_1__id_1",
·········
"rejectedPlans" : [
{
"stage" : "SORT",
"sortPattern" : {
"Num" : 1,
"_id" : 1
},
"inputStage" : {
"stage" : "SORT_KEY_GENERATOR",
·········
"executionStats" : {
"executionSuccess" : true,
"nReturned" : 499167,
"executionTimeMillis" : 1355,
"totalKeysExamined" : 499167,
"totalDocsExamined" : 499167,
"executionStages" : {
"stage" : "FETCH",
"nReturned" : 499167,
"executionTimeMillisEstimate" : 102,
"works" : 499168,
"advanced" : 499167,
"needTime" : 0,
"needYield" : 0,
"saveState" : 3901,
"restoreState" : 3901,
"isEOF" : 1,
"invalidates" : 0,
"docsExamined" : 499167,
"alreadyHasObj" : 0,
"inputStage" : {
"stage" : "IXSCAN",
"nReturned" : 499167,
"executionTimeMillisEstimate" : 14,
"works" : 499168,
·······

上述執行計劃說明：

winningPlan.stage：優化器選擇了FETCH+IXSCAN的Stage，而不是之前的Sort；這是最優的方式之一，也就是通過索引檢索指定的文件資料，並在索引中完成排序（”keyPattern” : {“Num” : 1,”_id” : 1}），效率最高
rejectedPlans：Sort 使用記憶體排序的方式被優化器棄用
executionSuccess：語句執行成功
nReturned：語句返回結果數為499167

三、引申的組合索引問題

上文中查詢語句explain()直接報錯，是因為組合索引為{Num_1_Name_1_id_1}，而查詢語句為sort({“Num”:1,”_id”:1})，未遵循最左原則，索引無法被使用到而後優化器選擇Sort Stage觸發了記憶體限制並Abort。

至於為啥MongoDB連執行計劃都不返回給你，可以後續再討論，歡迎評論

建立合適的組合索引後，查詢語句成功執行；那麼如果不按照索引的升降順序執行語句會怎樣？

1.查詢語句中，排序欄位 _id 使用降序

當前的組合索引為{“key” : {“Num” : 1, “_id” : 1} },也就是都為升序，而我們將查詢語句中排序欄位 _id使用降序排序時，查詢語句直接報錯，說明該語句也未使用到索引排序，而是使用的Sort Stage。

> db.data_test.find({'Num':{"$gt":500000}}).sort({"Num":1,"_id":-1}).explain('executionStats')
2019-06-19T19:32:30.939+0800 E QUERY [js] Error: explain failed: {
"ok" : 0,
"errmsg" : "Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.",
"code" : 96,
"codeName" : "OperationFailed"
}

2.查詢語句中，排序欄位 Num 和 _id 全部使用降序

我們現在將查詢語句的排序欄位全部使用降序，與組合索引全部相反再測試，執行成功。

> db.data_test.find({'Num':{"$gt":500000}}).sort({"Num":-1,"_id":-1}).explain('executionStats')
{
"queryPlanner" : {
······
"winningPlan" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"Num" : 1,
"_id" : 1
},
"indexName" : "Num_1__id_1",
·······
"rejectedPlans" : [
{
"stage" : "SORT",
·······
"executionStats" : {
"executionSuccess" : true,
·······
"inputStage" : {
"stage" : "IXSCAN",
·······
"indexName" : "Num_1__id_1",
······
"ok" : 1
}

再次做其他查詢組合測試 sort({“Num”:-1,”_id”:1})，執行依然失敗；說明只有在排序列的升降序只有和組合索引中的方向保持 全部相同 或 全部相反，語句執行才能成功。

四、引申的聚合查詢問題

上文中的查詢測試語句是在 MongoDB Shell 執行的 find() 查詢方法，但是業務程式中查詢一般都是使用聚合查詢方法 aggregate()，對於聚合查詢中的Sort Stage，官方文件說明了使用記憶體排序能使用最大的記憶體為100M，若需要避免報錯則需要新增 {allowDiskUse : true} 引數。

The $sort stage has a limit of 100 megabytes of RAM. By default, if the stage exceeds this limit, $sort will produce an error. To allow for the handling of large datasets, set the allowDiskUse option to true to enable $sort operations to write to temporary files. See the allowDiskUse option in db.collection.aggregate() method and the aggregate command for details.

1.Sort stage 使用記憶體排序

將普通的 find() 方法轉為 aggregate() 聚合方法，語義不變，特意將排序欄位 _id 修改為降序 -1 ，那麼查詢計劃將無法使用到組合索引只能使用Sort stage。下文中查詢依然報錯，Sort stage操作使用的記憶體超過100M

> db.data_test.explain('executionStats').aggregate([{ $match : { Num : { $gt : 500000} } },{ $sort : { "Num" : 1, _id: -1 } }])
2019-06-19T20:28:43.859+0800 E QUERY [js] Error: explain failed: {
"ok" : 0,
"errmsg" : "Sort exceeded memory limit of 104857600 bytes, but did not opt in to external sorting. Aborting operation. Pass allowDiskUse:true to opt in.",
"code" : 16819,
"codeName" : "Location16819"
} :
_getErrorWithCode@src/mongo/shell/utils.js:25:13
throwOrReturn@src/mongo/shell/explainable.js:31:1
constructor/this.aggregate@src/mongo/shell/explainable.js:121:1
@(shell):1:1

新增 {allowDiskUse: true} 引數,可以使Sort stage操作繞過記憶體限制而使用磁碟，查詢語句可以執行成功：

> db.data_test.explain('executionStats').aggregate([{ $match : { Num : { $gt : 500000} } },{ $sort : { "Num" : 1, _id: -1 } }],{allowDiskUse: true})
{
"stages" : [
······
"executionStats" : {
"executionSuccess" : true,
"nReturned" : 499167,
"executionTimeMillis" : 4128,
"totalKeysExamined" : 499167,
"totalDocsExamined" : 499167,
······
{
"$sort" : {
"sortKey" : {
"Num" : 1,
"_id" : -1
}
}
}
],
"ok" : 1
}

五、結論

1.排序記憶體限制的問題

MongoDB使用記憶體進行排序的場景只有是Sort stage，官方文件有說明：

If MongoDB can use an index scan to obtain the requested sort order, the result will not include a SORT stage. Otherwise, if MongoDB cannot use the index to sort, the explain result will include a SORT stage.

意思大概是如果MongoDB可以使用索引掃描來進行排序，那麼結果將不包括SORT stage。否則如果MongoDB無法使用索引進行排序，那麼查詢計劃將包括SORT stage。

使用索引掃描的效率是遠大於直接將結果集放在記憶體排序的，所以MongoDB為了使查詢語句更有效率的執行，限制了排序記憶體的使用，因而規定了只能使用 32M，該種考慮是非常合理的。

但也可通過手工調整引數進行修改（不建議）：

# 比如調大到 128M
## 線上調整
> db.adminCommand({setParameter:1, internalQueryExecMaxBlockingSortBytes:134217728})
## 持久到配置檔案
setParameter:
internalQueryExecMaxBlockingSortBytes: 134217728

2.使排序操作使用到索引

1)為查詢語句建立合適的索引如果查詢中排序是單列排序，如sort({“Num”:1})，那麼只需新增為 Num 列新增索引即可，排序的順序無影響

## 例如索引為 {'Num':1},查詢不管升/降序都可使用到索引排序
db.data_test.find().sort({Num:1}) 
db.data_test.find().sort({Num:-1})

如果查詢中排序是使用組合排序，如sort({“Num”:1,”id”:1}),那麼需要建立對應的組合索引，如{“key” : {“Num” : 1, “_id” : 1} 或者 {“key” : {“Num” : -1, “_id” : -1}

## 例如索引為{"Num" : 1, "_id" : 1}，可以用到索引排序的場景為
db.data_test.find().sort({Num:1,_id:1})
db.data_test.find().sort({Num:-1,_id:-1})

注意保持查詢中組合排序的升降序和組合索引中的方向保持全部相同或全部相反

2)注意字首索引的使用

上文查詢報錯的案例分析已說明了組合索引每一個鍵的順序非常重要，這將決定該組合索引在查詢過程中能否被使用到，也將是MongoDB的索引及排序同樣需遵循最左字首原則。

3. 聚合查詢新增allowDiskUse選項

儘可能的保證查詢語句的排序能夠使用索引排序，但如果業務需要規避排序記憶體限制報錯的問題，那麼需要在程式碼中新增 {allowDiskUse : true} 引數。

六、參考文獻

https://docs.mongodb.com/manual/tutorial/sort-results-with-indexes/index.html

https://docs.mongodb.com/manual/reference/operator/aggregation/sort/#sort-memory-limit

https://docs.mongodb.com/manual/reference/explain-results/#executionstats

相關推薦

技術分享 | MongoDB 一次排序超過記憶體限制的排查

作者：任仲禹本文目錄：一、背景 1. 配置引數檢查 2. 排序欄位是否存在索引二、測試環境模擬索引對排序的影響

記一次核心模組記憶體越界排查

本文記錄一次核心模組記憶體越界，導致故障的排查分析過程，和各位共享交流。異常都是在系統啟動階段出的。異常資訊一： [ 6.854984] BUG: Bad page state in process khelper pfn:6db6d9addc07010f [

記一次生產環境記憶體故障排查

最近生產環境經常有個伺服器出現記憶體報警，上面跑了個java介面服務，但大概一段時間後會自動恢復。報警如下圖：由於故障已自動恢

日誌監控文件中獲取ip，每一分鐘統計一次，超過200次的計入黑名單

utf-8 spl color bsp 死循環 odin 分割名單 true 一、日誌文件access.log #1、要從日誌裏面找到1分鐘之內訪問超過200次的 #2、每分鐘都運行一次 #1、讀取文件內容，獲取到ip地址 #2、把每個ip地址存起來｛｝ #3、判斷i

CLANG技術分享系列一:編寫你的第一個CLANG外掛

轉：http://kangwang1988.github.io/blog/ 引子以前遇到一個需求，檢測iOS App程式碼中使用到的API是否存在開始支援的系統版本高於當前deploy target，或已經在當前支援的最新系統之前(包括當前系統)已經被標記為棄用(depr

Cookie瀏覽器會話技術顯示上一次登陸時間

案例: 可以顯示上一次登陸時間記錄上次訪問的時間需求: 當用戶第一次登陸的時候,提示:你是第一次登陸,且記錄該次訪問時間

記一次Mysql佔用記憶體過高的優化過程

一.環境說明：作業系統：CentOS 6.5 x86_64 資料庫：Mysql 5.6.22 伺服器：阿里雲VPS，32G Mem，0 swap 二.問題情況： 1.某日發現公司線上系統的Mysql某個例項的從庫長時間記憶體佔用達到60%如下圖 2.於是開始

一次頻繁Full GC問題排查過程分享

問題描述應用收到頻繁Full GC告警問題排查登入到對應機器上去，檢視GC日誌，發現YGC一分鐘已經達到了15次，比Full GC還要頻繁一些，其中Full GC平均10分鐘超過了4次，如下圖使用jstat -gcutil 5280 1000檢視實時GC情況，年老代採用的是CMS收集器，發現觸

典型的Top K演算法 _找出一個數組裡面前K個最大數_找出1億個浮點數中最大的10000個_一個文字檔案，找出前10個經常出現的詞，但這次檔案比較長，說是上億行或十億行，總之無法一次讀入記憶體.

搜尋引擎會通過日誌檔案把使用者每次檢索使用的所有檢索串都記錄下來，每個查詢串的長度為1-255位元組。假設目前有一千萬個記錄（這些查詢串的重複度比較高，雖然總數是1千萬，但如果除去重複後，不超過3百萬個。一個查詢串的重複度越高，說明查詢

記一次ORACLE伺服器記憶體調整

查詢大批量資料時，網頁載入資料太慢，所以打算調一下資料庫儲存，中間出了一些問題並解決，現做記錄。1. sqlplus調整記憶體:SQL> alter system set sga_max_size=2048M scope=spfile; System altered.

記錄一次堆外記憶體溢位

注：其實問題並不是由我排查的，只是想記一下思路，來推動自己的進步 # 問題描述：　　一個使用kafka進行流處理的專案不斷髮生 oom 被系統kill掉的情況 # 分析排查　　1. 剛開始的時候專案啟動時並沒有指定初始堆記憶體，先假設是因為堆記憶體使用過大導致系統記憶體使用100%而被kill掉　　問題

記一次hive的記憶體溢位(OutOfMemoryError: Java heap space)排查

轉載請註明出處：http://blog.csdn.net/gklifg/article/details/50418109 剛剛從java組轉崗找資料組，學習大資料的知識，開發語言也從java轉到python新奇之外也遇到了諸多問題，其中最令我頭疼的就是在hive上的統計任務

科大訊飛技術面——及第一次正式的面試

感想科大訊飛作為一個被“MIT科技評論”評委中國第一，全球第六的企業【可自行百度】最近股票可是噌噌噌的往上漲啊。。。於是，懷著激動地的心情去面試科大訊飛的技術支援工程師，結果簽到的時候人家告訴我面試崗位是硬體工程師，心中頓時一萬頭... ...奔過，就想說本寶寶已經有多

MongoDB一次節點宕機引發的思考(原始碼剖析)

目錄簡介日誌分析副本集如何實現 Failover 心跳的實現 electionTimeout 定時器業務影響評估參考連結

一次 RocketMQ 程序自動退出排查經驗分享（實戰篇）

1、背景公司一個 RocketMQ 叢集由4主4從組成，突然其中3臺伺服器“竟然”在同一時間下線，其監控顯示如下：依次檢視三臺機器的監控圖形，時間戳幾乎完美“吻合”，不可思議吧。 2、故障分析出現問題，先二話不說，馬上重啟各伺服器，儘快恢復叢集，降低對業務的影響，接下來開始對日誌進行分析。 Java

記一次golang的記憶體洩露

程式功能此程式的主要功能是將檔案中資料匯入到clickhouse資料庫中。【問題描述】伺服器記憶體每隔一段時間會耗盡【問題分析】由於使用的是go語言開發的，所以採用了業界流行的工具pprof。參考URL:https://cizixs.com/2017/09/11/profiling-golan

記錄一次concurrent mode failure問題排查過程以及解決思路

tails only cnblogs 策略 executor red execute incr run 背景：後臺定時任務腳本每天淩晨5點30會執行一個批量掃庫做業務的邏輯。 gc錯誤日誌： 2017-07-05T05:30:54.408+0800: 518534

記一次JVM Metaspace溢出排查

jvm參數 oom task visualvm map 排除創建 thread 類裝載多圖預警！環境：系統測試(Windows Server/JRE8/tomcat7) 現象：應用運行幾天後，出現訪問超時，服務器cpu利用率居高不下問題日誌：OutOfMemory

TPS低，CPU高--記一次storm壓測問題排查過程

進入狀態其他 value 由於均衡線程狀態左右 grep 命令一、業務背景+系統架構本次場景為kafka+storm+redis+hbase，通過kafka的數據，進入storm的spout組件接收，轉由storm的Bolt節點進行業務邏輯處

記一次LINUX-CRONTAB失敗的排查案例

一段時間執行 linu linux-c 權限排查左右完成進行在LINUX中，使用crontab來做計劃任務是一件很常見的事。本文記錄一次排查過程故障描述在crontab 設置計劃任務，每天淩晨3點執行腳本 conrtab(3點）tomcat用戶--執行腳本