FEM：整合RANSEQ和DNA甲基化資料分析的R包

阿新 • • 發佈：2020-09-12

FEM是一個整合RANSEQ和DNA甲基化資料的R包，由Andrew E. Teschendorff 和 Zhen Yang 開發、維護。

不多說，下面介紹如何使用FEM整合RANSEQ和DNA甲基化資料分析。

1、安裝、下載FEM

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("FEM")
library(FEM)

2、下載資料adj.m

adj.m資料儲存在網址（https://sourceforge.net/projects/signalentropy/files/?source=navbar）的“hprdAsigH-13Jun12.Rd”上，下載“hprdAsigH-13Jun12.Rd”即可。

“hprdAsigH-13Jun12.Rd”檔案包含三個資料："hprdAsigH.m"、"sigHclassA.v"、"sigHclassA2.v"

"hprdAsigH.m"為我們後續分析需要的資料。

“hprdAsigH-13Jun12.Rd”資料也可以通過公眾號bio生物資訊後臺發生關鍵字“FEM”獲得。

3、準備DNA甲基化資料

DNA甲基化資料取得是beta值，這裡我們命名為“beta”，示例圖如下所示：

行名為每個CpG位點的ID，列名為每個樣本的ID。

4、準備DNA甲基化資料對應的表型檔案

DNA甲基化資料對於的表型檔案，我們命名為group，其示例圖如下所示：

表示為第一個樣本sample1是control，第二個樣本sample2是control，第三個樣本sample3是case，以此類推。beta檔案的sample和group是一一對應的。

5、準備RANSEQ基因表達資料

RANSEQ基因表達資料，我們命名為need，其示例如下所示：

行名是每一個基因的entrez gene IDs，列名是每一個樣本名。

6、準備RANSEQ基因表達資料對應的表型檔案

RANSEQ基因表達資料對應的表型檔案，我們命名為gg, 示例圖如下所示：

表示的是每一個樣本對應的是case還是control。與DNA甲基化的情況一樣，need檔案的sample和group是一一對應的。

7、生成DNA差異甲基化統計量

如果是850k，則用以下命令：

statM.o=GenStatM(beta,group,"EPIC")

如果是450K，則用以下命令：

statM.o=GenStatM(beta,group,"450K")

生成的statM.o結果包含三個資料："top"、 "cont"、"avbeta"

"top"是差異甲基化的統計結果,top是一個list，差異甲基化結果一般儲存在top的第一個元素（item）中；

"cont"是差異甲基化分析時構建的case-control；

"avbeta"是DNA甲基化資料；

8、生成差異表達的統計量

使用命令：

statR.o=GenStatR(need,gg)

生成的statR.o結果包含三個資料： "top"、"cont"、"avexp"

與差異甲基化的結果類似， "top"是差異表達的統計結果；

"cont"是差異表達分析時構建的case-control；

"avbeta"是表達資料；

9、整合差異表達和差異甲基化資料

load("/data/chenwenyan/hprdAsigH-13Jun12.Rd")
re=DoIntFEM450k(statM.o,statR.o,hprdAsigH.m,1,1,"avbeta")

解釋一下，statM.o和statR.o分別是步驟7和8產生的結果檔案，hprdAsigH.m是步驟2下載的“hprdAsigH-13Jun12.Rd”檔案包含的資料,這裡我儲存在/data/chenwenyan/路徑下，請讀者們根據各自儲存的路徑自行修改，不要完成照抄我的路徑。

兩個1分別指的是statM.o和statR.o的top資料的第一個檔案，即步驟7和8生成的差異甲基化和差異表達結果。

這裡需要注意的是，如果你感興趣的分組結果儲存在top資料的第二個元素，則程式碼需要改成re=DoIntFEM450k(statM.o,statR.o,hprdAsigH.m,2,2,"avbeta")

10、鑑定甲基化與表達之間存在負相關的基因

DoFEMbi=DoFEMbi(re, nseeds = 100, gamma = 0.5, nMC = 1000, sizeR.v = c(1,100), minsizeOUT = 10, writeOUT = TRUE, nameSTUDY = "TEST", ew.v = NULL)

這裡所有引數均可以使用預設值。

輸出的DoFEMbi結果包含以下檔案：

這裡我們主要關注fem和topmod這兩個元素,分別指的是模組以及模組對應的統計資料，如下所示：

11、視覺化結果

視覺化SGMS2模組資訊：

SGMS2=FemModShow(DoFEMbi$topmod$SGMS2,name="SGMS2", DoFEMbi)

畫出來的圖如下所示,可以看到，這個模組的基因主要是高甲基化低表達：

FEM：整合RANSEQ和DNA甲基化資料分析的R包

FEM是一個整合RANSEQ和DNA甲基化資料的R包，由Andrew E. Teschendorff 和 Zhen Yang 開發、維護。

綜述：單細胞DNA甲基化分析方法全介紹及未來發展前景預測｜易基因

大家好，這是專注表觀組學十餘年，領跑多組學科研服務的易基因。 2021年07月10日，《Biomolecules》雜誌上發表一篇關於單細胞表觀測序的綜述文章，詳細介紹了單細胞DNA甲基化的實驗策略、分析方法、資料分析以

SOLIDWORKS: Integrated CAM with HSMXpress SOLIDWORKS：整合CAM和HSMXpress Lynda課程中文字幕

SOLIDWORKS: Integrated CAM with HSMXpress 中文字幕 SOLIDWORKS：整合CAM和HSMXpress 中文字幕SOLIDWORKS: Integrated CAM with HSMXpress

SpringBoot第四集：整合JdbcTemplate和JPA（2020最新最易懂）

SpringBoot第四集：整合JdbcTemplate和JPA（2020最新最易懂）　　當前環境說明：　　Windows10_64

Nature | 易基因DNA甲基化測序助力人多能幹細胞向胚胎全能8細胞的人工誘導

北京時間2022年3月22日凌晨，《Nature》期刊線上刊登了由中國科學院廣州生物醫學與健康研究所等單位牽頭，深圳市易基因科技有限公司、中國科學技術大學等單位參與，應用人多能幹細胞向胚胎8細胞狀態人工誘導的科研

真實感渲染：WebGPU介紹和使用光柵化管線繪製一個三角形

大家好~本課程為“真實感渲染”的線上課程，從0開始，介紹相關的圖形學演算法和數學基礎，給出詳細的數學推導、虛擬碼和實現程式碼，最終帶領大家開發出基於物理的渲染器

資料顯示：2020 年華為全球模組化資料中心市場份額達 20.5%，排名第一

10 月 23 日訊息，第三方諮詢機構 Frost & Sullivan 近日釋出的《全球模組化資料中心市場報告》顯示，華為智慧微模組解決方案全球市場份額從 2017 年的 12.7% 上升至 2020 年的 20.5%，位居全球第一。報告顯示，

SpringBoot整合reids之JSON序列化資料夾操作

前言最近在開發專案，用到了redis作為快取，來提高系統訪問速度和緩解系統壓力，提高使用者響應和訪問速度，這裡遇到幾個問題做一下總結和整理

國家生物資訊中心釋出「癌症單細胞表達圖譜」資料庫：整合 208 個癌症 scRNA-seq 資料集

12 月 4 日訊息，據中科院官網，近日，中國科學院北京基因組研究所（國家生物資訊中心）國家基因組科學資料中心開發的癌症單細胞表達圖譜資料庫 CancerSCEM 上線。據介紹，ancerSCEM 1.0 版本整合分析了 208 個癌症

Python使用SQLite和Excel操作進行資料分析

昨日，女票拿了一個Excel文件，裡面有上萬條資料要進行分析，剛開始一個欄位分析，Excel用的不錯，還能搞定，到後來兩個欄位的分析，還有區間比如年齡段的資料分析，實在是心疼的不行，於是就想給她程式處理之。

R語言面板資料分析 plm包實現（固定效應模型和組內模型）

這裡寫目錄標題 1.安裝plm包 2.問題描述 3.pool 模型 4.個體固定效應的Panel模型——不考慮時間差異，考慮公司差異的估計

[資料科學筆記]第3章 OLAP與結構化資料分析

技術標籤：資料科學概論資料庫資料倉庫大資料機器學習資料分析 OLAP與結構化資料分析

python爬蟲——什麼值得買平臺家電視覺化資料分析

一、選題背景　　現如今社會上，我們常見得購物方式大多數都是通過網上購物來解決日常剛需。尤其是80，90，00後日常生活已經離不開這樣子得生活方式。但是在碰到買家電得時候我們通常會去、蘇寧易購、京東這些平臺買

央視起底網路占卜亂象：人臉識別、人工智慧、大資料分析等等名目種類繁多

1 月 23 日訊息，農曆新年將近，不少年輕人開始熱衷於占星卜卦，有的預測來年的工作、有的尋找婚姻，那麼這些所謂的算命活動，是否有依據呢？背後又隱藏著怎樣的祕密呢？央視今日就為大家帶來了一起特別節目，揭曉了

第四章結構化資料分析

1. 結構化資料分析及OLAP相關概念 (1) 資料倉庫資料庫經抽取，轉換和裝載建立資料倉庫

【Python環境】Python中的結構化資料分析利器-Pandas簡介

Pandas是python的一個數據分析包，最初由AQR Capital Management於2008年4月開發，並於2009年底開源出來，目前由專注於Python資料包開發的PyData開發team繼續開發和維護，屬於PyData專案的一部分。Pandas最初被作為金

拓端tecdat|Python進行多輸出（多因變數）迴歸：整合學習梯度提升決策樹GRADIENT BOOSTING REGRESSOR迴歸訓練和預測視覺化

原文連結：http://tecdat.cn/?p=25939 原文出處：拓端資料部落公眾號在之前的文章中，我們研究了許多使用多輸出迴歸分析的方法。在本教程中，我們將學習如何使用梯度提升決策樹GRADIENT BOOSTING REGRESSOR擬合

綜述：如何研究植物基因組DNA羥甲基化（5hmC）？｜易基因

大家好，這裡是專注表觀組學十餘年，領跑多組學科研服務的易基因。概述：

WCF初探-24：WCF序列化和反序列化

前言 WCF包含很多封裝的內部機制，這些是我們在編寫程式時不會經常看到的。比如上一篇講解的Message。這一篇我將講解WCF的另一種內部機制，WCF的序列化和反序列化。通常我們在編寫WCF服務程式的時候，我們並沒有手

華為路由初始化1：console密碼和遠端登入

使用者檢視修改系統時鐘配置登入歡迎資訊配置console埠登入密碼 <Huawei>sys //登入系統檢視

FEM：整合RANSEQ和DNA甲基化資料分析的R包

1、安裝、下載FEM

2、下載資料adj.m

3、準備DNA甲基化資料

4、準備DNA甲基化資料對應的表型檔案

5、準備RANSEQ基因表達資料

6、準備RANSEQ基因表達資料對應的表型檔案

7、生成DNA差異甲基化統計量

8、生成差異表達的統計量

9、整合差異表達和差異甲基化資料

10、鑑定甲基化與表達之間存在負相關的基因

11、視覺化結果

相關推薦