一次容器化springboot程式OOM問題探險

背景

運維人員反饋一個容器化的java程式每跑一段時間就會出現OOM問題，重啟後，間隔大概兩天後復現。

問題調查

一查日誌

由於是容器化部署的程式，登上主機後使用docker logs ContainerId檢視輸出日誌，並沒有發現任何異常輸出。使用docker stats檢視容器使用的資源情況，分配了2G大小，也沒有發現異常。

二缺失的工具

打算進入容器內部一探究竟,先使用docker ps 找到java程式的ContainerId
,再執行docker exec -it ContainerId /bin/bash進入容器。進入後，本想著使用jmap、jstack 等JVM分析命令來診斷，結果發現命令都不存在，顯示如下：

bash: jstack: command not found
bash: jmap: command not found
bash: jps: command not found
bash: jstat: command not found

突然意識到，可能打映象的時候使用的是精簡版的JDK，並沒有這些jVM分析工具，但是這仍然不能阻止我們分析問題的腳步，此時docker cp命令就派上用場了，它的作用是：在容器和宿主機之間拷貝檔案。這裡使用的思路是：拷貝一個新的jdk到容器內部，目的是為了執行JVM分析命令，參照用法如下：

Usage:  docker cp [OPTIONS] CONTAINER:SRC_PATH DEST_PATH|-
        docker cp [OPTIONS] SRC_PATH|- CONTAINER:DEST_PATH [flags]

有了JVM工具，我們就可以開始分析咯。

三查GC情況

通過jstat檢視gc情況

 bin/jstat -gcutil 1 1s

看樣子沒有什麼問題，full gc也少。再看一下物件的佔用情況，由於是容器內部，程序號為1，執行如下命令：

bin/jmap -histo 1 |more

發現ByteBuffer物件佔用最高，這是異常點一。

四查執行緒快照情況

通過jstack檢視執行緒快照情況。

 bin/jstack -l 1 > thread.txt

下載快照，這裡推薦一個線上的執行緒快照分析網站。

https://gceasy.io

上傳後，發現建立的執行緒近2000個，且大多是TIMED_WAITING狀態。感覺逐漸接近真相了。點選詳情發現有大量的kafka-producer-network-thread | producer-X 執行緒。如果是低版本則是大量的ProducerSendThread執行緒。(後續驗證得知)，可以看出這個是kafka生產者建立的執行緒，如下是生產者傳送模型：

根據生產者的傳送模型，我們知道，這個sender執行緒主要做兩個事，一是獲取kafka叢集的Metadata共享給多個生產者，二是把生產者送到本地訊息佇列中的資料，傳送至遠端叢集。而本地訊息佇列底層的資料結構就是java NIO的ByteBuffer。

這裡發現了異常點二：建立過多kafka生產者。

由於沒有業務程式碼，決定寫一個Demo程式來驗證這個想法，定時2秒建立一個生產者物件，傳送當前時間到kafka中，為了更好的觀察，啟動時指定jmx埠，使用jconsole來觀察執行緒和記憶體情況,程式碼如下：

nohup java -jar -Djava.rmi.server.hostname=ip 
 -Dcom.sun.management.jmxremote.port=18099
 -Dcom.sun.management.jmxremote.rmi.port=18099
 -Dcom.sun.management.jmxremote.ssl=false
 -Dcom.sun.management.jmxremote.authenticate=false -jar
 com.hyq.kafkaMultipleProducer-1.0.0.jar   2>&1 &

連線jconsole後觀察，發現執行緒數一直增長，使用記憶體也在逐漸增加,具體情況如下圖：

故障原因回顧

分析到這裡，基本確定了，應該是業務程式碼中迴圈建立Producer物件導致的。
在kafka生產者傳送模型中封裝了 Java NIO中的 ByteBuffer 用來儲存訊息資料，ByteBuffer的建立是非常消耗資源的，儘管設計了BufferPool來複用，但也經不住每一條訊息就建立一個buffer物件，這也就是為什麼jmap顯示ByteBuffer佔用記憶體最多的原因。

總結

在日常的故障定位中，多多使用JDK自帶的工具，來幫助我們輔助定位問題。一些其他的知識點：
jmap -histo顯示的物件含義：

[C 代表  char[]
[S 代表 short[]
[I 代表 int[]
[B 代表 byte[]
[[I 代表 int[][]

如果匯出的dump檔案過大，可以將MAT上傳至伺服器，分析完畢後，下載分析報告檢視，命令為：

./mat/ParseHeapDump.sh active.dump  org.eclipse.mat.api:suspects
org.eclipse.mat.api:overview org.eclipse.mat.api:top_components

可能儘快觸發Full GC的幾種方式

1) System.gc();或者Runtime.getRuntime().gc();

2 ) jmap -histo:live或者jmap -dump:live。
這個命令執行，JVM會先觸發gc，然後再統計資訊。
3） 老生代記憶體不足的時候
  
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    一次容器化springboot程式OOM問題探險
      背景
運維人員反饋一個容器化的java程式每跑一段時間就會出現OOM問題，重啟後，間隔大概兩天後復現。
問題調查
一查日誌
由於是容器化部署的程式，登上主機後使用docker logs ContainerId檢視輸出日誌，並沒有發現任何異常輸出。 使用docker stats檢視容器使用的資源情況，分配了2G 

  
 

    

    
    當python，單例模式，多例模式，一次初始化遇到一起
      end   light   答案   註意   找到   一次   turn   相關   表示   1.在python中，單例模式是很容易實現的，隨便翻翻網上的相關教程，就能夠找到很多答案。
比如這樣：

class hello(object):

    def __new__(cls, *args, * 

  
 

    

    
    記一次簡單的破解程式(逆向)
      已投稿合天 
載入以後然後隨便輸入一個密碼然後在程式中搜索報錯資訊。 
例如如下搜尋的： 
 
 
  
 
然後雙擊進入。 
 
然後發現JE將其修改為JEN（JE是==，而JEN是!=，如此便打破了原有的邏輯） 
右鍵編輯->二進位制編輯 
 
將74改為75（這裡所說的74、75就是JE 

  
 

    

    
    一次心血來潮的C程式編譯 && makefile
      
							
							
							前言
想複習下資料結構，所以看了看相關的課程後打算手寫一些東西，比如連結串列或者說其他的常用資料結構。
環境

MacOSX
VSCode

本來打算在xcode上直接寫純C的程式的，但是寫了幾行就發現。。真雞兒麻煩啊，而且我xcode用的也不好，各種快捷鍵也不 

  
 

    

    
    記一次大坑：SpringBoot+Mybatis專案中，配置檔案中的修改了SQL語句後不生效
      
                問題：原是SSM框架專案，轉移到SpringBoot+Mybatis，使用的是C3P0連線資料庫。轉移到SpringBoot後的專案，我修改了xml配置檔案中的查詢sql語句，也就是增加了一個查詢欄位，無論是在前端頁面測試，還是使用單元測試時候，我修改後的SQL就是不生效，查 

  
 

    

    
    記一次docker部署springboot專案,mysql以及redis一樣是docker中安裝
      
							
							
							一：首先  在idea中的springboot專案打成jar包,具體是方式是如下 
 
 
這裡的資料庫密碼和賬戶必須是真確的，資料庫和redis也是在docker中安裝的

二:在docker中安裝mysql的服務 
 這裡的linux的版本是centos,具 

  
 

    

    
    Devops關鍵工具及技術(一)—Jenkins 容器化
      
							
							
							在進行Devops思想與方法論落地的過程中，Jenkins這個開源的軟體基本上會成為我們的首選，因為它的成熟度以及外掛的豐富程度都無法讓我們拒絕它。而隨著Jenkins 2.0的釋出，Pipeline As Code的理念，無疑給Jenkins使用者在Devop 

  
 

    

    
    記一次微信小程式原始碼反解包
      
							
							
							



安裝完成後在安裝目錄下新建兩個資料夾：
node-cache
node-global
（這是用來放npm全域性模組的安裝目錄，也可以放到其他地方。）

二 配置環境變數



變數名：NODE_HOME
變數值（你的安裝目錄）：C:\Program Fi 

  
 

    

    
    記一次微信小程式在安卓的白屏問題
      
 在做小程式的時候，做到了一個限時商品售賣，用到了倒計時，因為這個原因導致了安卓手機上使用小程式時，將小程式放入後臺執行一段時間後，再次進入小程式後出現了頁面白屏或者點選事件失效的情況，這裡記錄下
 
1.相關程式碼檔案 

 我這裡是使用了自定義元件的形式來渲染的
 

 外部的引用的自定義元件的wxml 

  
 

    

    
    第一次只出現一次的字元（程式設計師面試題精選100題）
      
                
題目：在一個字串中找到第一個只出現一次的字元。如輸入abaccdeff，則輸出b。
分析：這道題是2006年google的一道筆試題。

方法一：
        最直觀的想法是從頭開始掃描這個字串中的每個字元。當訪問到某字元時拿這個字元和後面的每個字元相比較，如果在後面沒 

  
 

    

    
    記錄一次ssm轉springboot專案過程
       
 
 其實這個專案是springboot的專案，但是不知道為什麼，裡面的配置幾乎都是xml的形式配置的，包括spring-web的配置。不過，既然咱接手了這怎麼能受得了。於是將所有的標籤轉成springboot的。百度上對這方面幾乎沒有資料。也是，springboot的架子裡面用springmvc配置這種 

  
 

    

    
    記一次序列化的JSON解析問題
      
    目錄
    
        
        
        一、問題初探
        二、問題原因
        三、解決問題
        
        
    


一、問題初探
我今天在使用Ribbon 遠端呼叫的時候
消費者去消費服務端所提供的服務，在使用Post請求中 

  
 

    

    
    Rio手把手教學：如何打造容器化應用程式的一站式部署體驗
      11月19日，業界應用最為廣泛的Kubernetes管理平臺建立者Rancher Labs（以下簡稱Rancher）宣佈Rio釋出了beta版本，這是基於Kubernetes的應用程式部署引擎。它於今年5月份推出，現在最新的版本是v0.6.0。Rio結合了多種雲原生技術，從而簡化了將程式碼從測試環境釋出到生產 

  
 

    

    
    這一次搞懂SpringBoot核心原理（自動配置、事件驅動、Condition）
      @[TOC]
# 前言
SpringBoot是Spring的包裝，通過自動配置使得SpringBoot可以做到開箱即用，上手成本非常低，但是學習其實現原理的成本大大增加，需要先了解熟悉Spring原理。如果還不清楚Spring原理的，可以先檢視博主之前的文章，本篇主要分析SpringBoot的啟動、自動配置、 

  
 

    

    
    記一次語音轉文字程式的開發-當一次野生字幕君
      # 下一秒我就是野生字幕君

最近劇荒，偶然翻出了曾經下載的電視劇回味一番，經典就是經典，不論是劇情還是臺詞，都那麼有魅力，咦？等等，臺詞，臺詞……作為一個IT從業者，我忽然靈光一現——現在語音識別技術這麼發達，能否有什麼辦法能幫我儲存下一些精彩橋段的臺詞呢？或許我也可以是個野生字幕君:p ,似乎也可以在此基 

  
 

    

    
    JAVA 中類如何只實例化一次（單例模式）
      回來   記錄   實例   static   ret   clas   實例化   best   pub   以前只運用過單例模式，但是沒有具體的了解過單例模式的含義，今天去面試讓一下一個類只實例化一次，想了好久沒想出來，回來查了資料才知道是單例模式，記錄下來。public class Singleton  

  
 

    

    
    記Angular與Django REST框架的一次合作（2）：前端組件化——Angular
      服務器   信息   outer   demo   cli   組成   控制   set   根據   註：這是這個系列的第二部分，主要集中在Angular的使用方面。之前使用過AngularJS（Angular 1.x），混在Django的模板中使用，這些頁面一般完全是結果展示頁。在有Django表單輸入 

  
 

    

    
    記一次springboot啟動不起來的經歷
      最新   lips   檢查   boot   register   cli   down   一次   shu   在用eclipse+maven構建一個基本的springboot的web應用時在執行main方法（一個基本的springApplication類）出現Unregistering JMX-exp 

  
 

    

    
    記一次OOM排查解決
      Hibernate   內存溢出   Hibernate緩存   OutOfMemoryError   Java heap space   現場人員反饋tomcat假死，已不能訪問，而且一直報如下異常：SEVERE:Memory usage is low, parachute is non existent, 

  
 

    

    
    記一次Springboot啟動異常
      figure   trac   new   rtc   ttr   org   ext   b-s   nested   　　啟動Springboot項目報以下異常：
　　

org.springframework.context.ApplicationContextException: Unable to