1. 程式人生 > >微生物測序分析LEfSe

微生物測序分析LEfSe

LEfse分析定義 LEfse分析即LDA Effect Size分析,可以實現多個分組之間的比較,還進行分組比較的內部進行亞組比較分析,從而找到組間在丰度上有顯著差異的物種(即biomaker);

主要是通過非引數因子Kruskal-Wallis秩和檢驗來實現的。

執行LEfSe軟體主要分三大步驟:第一步:需要把普通的物種、基因等等的丰度資訊的表格轉化成LEfSe識別的格式。這一步會生成.in結尾的檔案

第二步:這一步也是最關鍵的一步,統計顯著差異的biomarker、統計子組組間差異、統計effect sizes(LDA score),會生成.res格式的檔案。如下圖所示Step1:兩組或兩組以上的樣本中採用的非引數因子Kruskal-Wallis秩和檢驗檢測出biomarker。

Step2:基於上步的顯著差異物種基因,進行兩兩組之間的Wilcoxon秩和檢驗,檢測出組間差異。

Step3:線性判別分析(LDA)對biomarker進行評估差異顯著的物種的影響力(即LDA score),最終獲得biomarker。第三步:基於第二大步的資料,繪製各種圖片。如下圖所示


LDA值分佈柱狀圖:

展示了LDA score大於設定值有差異的物種,即具有統計學差異的biomaker。展現不同組中丰度有顯著差異的物種,柱狀圖的長度代表顯著差異物種的影響大小;

進化分支圖:

由內至外輻射的圓圈代表了由門至屬(或種)的分類級別。在不同分類級別上的每一個小圓圈代表該水平下的一個分類,小圓圈直徑大小與相對丰度大小呈正比。

著色原則:無顯著差異的物種統一著色為黃色,差異物種 Biomarker跟隨組進行著色,紅色節點表示在紅色組別中起到重要作用的微生物類群,綠色節點表示在綠色組別中起到重要作用的微生物類群,其它圈顏色意義類同。圖中英文字母表示的物種名稱在右側圖例中進行展示。

biomaker在不同組各樣本中的丰度比較圖:

將biomaker丰度最高的樣本的丰度設定為1,其他樣品中該 biomarker 的丰度為相對於丰度最高樣品的相對值。