TCGAbiolinks（知乎整理）

阿新 • • 發佈：2018-10-09

註意 tis 定義 different dea bar 轉換 dexp mage

setwd(‘D:/tcgabio‘)
rm(list = ls())

# TCGA-12-4567-01-blah-blah --> 這是Normal
# TCGA-12-4567-11-blah-blah --> 這是tumor
# 註意黑體的部分。01-09是tumor；10-19是Normal；20-29是Control
library(TCGAbiolinks)
# 下載前的query
query <- GDCquery(project = "TCGA-COAD", 
                    data.category = "Transcriptome Profiling", 
                    data.type = "Gene Expression Quantification", 
                    workflow.type = "HTSeq - FPKM-UQ")
GDCdownload(query)
# 將下載好的query轉換成一個SummerizedExperiment的文件，這個以rda為後綴的文件是一個總結性文件，
# 有了它，我們可以不再需要之前下載的raw數據，所以後面的remove.files.prepared可以選擇True，
# 這樣會把之前下載的大量文件刪除，當然也可以留著不刪除（即default）。
dataCOAD <- GDCprepare(query, save = TRUE, 
                       save.filename = "dataCOAD_summerizedExperiment.rda",
                       remove.files.prepared = TRUE)

# 可以看一看rda文件，用到的package是SummarizedExperiment
library(SummarizedExperiment)
samples.information=colData(dataCOAD)

# 數據準備好了，我們接下來開始進行DEA分析。所謂DEA，也就是Differential Expression Analysis，將Tumor組和對照組進行比較。
# 首先，將剛才GDCprepare好的數據進行normalization，用normalization()
# 這裏註意geneInfo=geneInfoHT，default其實是geneInfo，但由於我們前面選擇的是HTseq，所以要選擇geneInfoHT


dataNorm <- TCGAanalyze_Normalization(tabDF = dataCOAD, geneInfo = geneInfoHT)

# 之後，常規選擇，用Filtering()

dataFilt <- TCGAanalyze_Filtering(tabDF = dataNorm,
                                  method ="quantile", 
                                  qnt.cut = 0.25)

# 接著，定義對照組（這裏的對照組是Solid normal tissue），用到SampleType()，定義腫瘤組，用SampleType()

samplesNT <- TCGAquery_SampleTypes(barcode = colnames(dataFilt),
                                   typesample = c("NT"))

samplesTP <- TCGAquery_SampleTypes(barcode = colnames(dataFilt), 
                                   typesample = c("TP"))

# 進行DEA分析，用到DEA()

dataDEGs <- TCGAanalyze_DEA(mat1 =dataFilt[,samplesNT],
                            mat2 = dataFilt[,samplesTP],
                            Cond1type = "Normal",
                            Cond2type = "Tumor",
                            fdr.cut = 0.01 ,
                            logFC.cut = 1,
                            method = "glmLRT")
# 最後，將分析好的數據整入進一個表格裏，用到LevelTab()

dataDEGsFiltLevel <- TCGAanalyze_LevelTab(dataDEGs,"Tumor","Normal",
                                          dataFilt[,samplesTP],dataFilt[,samplesNT])

# 將表格保存到一個csv的文件
write.csv(dataDEGsFiltLevel,file="DEA_COAD.csv")

#最後得到得csv文件如下：

技術分享圖片

TCGAbiolinks（知乎整理）

註意 tis 定義 different dea bar 轉換 dexp mage setwd(‘D:/tcgabio‘) rm(list = ls()) # TCGA-12-4567-01-blah-blah --> 這是Normal # TCGA-12-4567

Java動態代理的理解（知乎轉發）

看完程式碼，現在我來回答，動態代理的作用是什麼：Proxy類的程式碼量被固定下來，不會因為業務的逐漸龐大而龐大；可以實現AOP程式設計，實際上靜態代理也可以實現，總的來說，AOP可以算作是代理模式的一個典型應用；解耦，通過引數就可以判斷真實類，不需要事先例項化，更加靈活多變。轉載自知乎：https://ww

深入淺出回撥函式（知乎上看到最好的回答）

回撥方法介紹之中國好室友篇（Java示例）前言在Java社群的各種開源工具中，回撥方法的使用俯拾即是。所以熟悉回撥方法無疑能加速自己對開源輪子的掌握。網上搜了一些文章，奈何對回撥方法的介紹大多隻停留在什麼是回撥方法的程度上。本篇文章嘗試從回撥方法怎麼來的、為什麼要使用回撥方法以及在實際專案中如何使用等方面來介

kaggle窺屏（知乎說入門需要獨立完成101和playground比賽）

1.titanic 主要是設計pd的資料處理，使用的是最簡單的regression模型，不太明白怎麼本地跑程式碼。 2.digital recognizer 3.我去，原來101說的是playground。 4.房價預測，可以使用RandomForestRegressor和De

面試總結（知乎＋京東）

知乎面試問題一面演算法題兩個有序陣列，輸出第k小的數字思想時：分別折半查詢，每個陣列記錄自己的left,right索引，進行查詢。 hashmap 原始碼結構 hashmap在擴容時空間建立＋新舊節點的對應關係＋如果擴容過程中查

寫一手好字：硬筆書法輕鬆自學指南（知乎週刊 Plus）-讀書筆記

寫一手好字：硬筆書法輕鬆自學指南（知乎週刊 Plus）知乎編輯團隊楷書，認知好字的範本 2017-03-16 《黃自元間架結構九十二法》選本好字帖 2017-03-16 先談書體。前人對練習書法的程式，各有主張。有的認為應由書體起源篆—隸—楷—行—草的演變

騰訊實習生面試2016兩道面試題目？（知乎）

第一個問題：引發bug的可能性有很多，形形色色的debug方法也有很多，它們各有各的優勢，並不存在通用的最優解，我目前用過的除錯方法有下面幾種： 1. 人肉除錯：對於某些bug，直接根據程式的異常表現，就可以知道問題程式碼的具體位置，心裡逆推演一下相關程式碼，就可以找到問題產生的原因。例：剛

如何買到便宜點的書（知乎）

最省錢的辦法是辦一張當地圖書館或者大學的借書證找一個當地的，愛書人多的Q群什麼的，提議大家換書看（錢鍾書老先生指出，追 MM 的一大手段就是借書，一來一往，又有共同話題，又多了見面的機會）京東、噹噹、亞馬遜等各大電商網站的書相對比實體店便宜，一般在書籍定價的七五折左右，而且時常還會有打折和返券的活動

如何成為一名優秀的程式設計師（知乎）

我不能算是一個很優秀的程式設計師，但這個問題我已經反覆思考了五年了。跟大家分享一下我的看法：首先，我認為答案絕對不是"只要寫很多年程式碼就好了“。我面試過不少有10年經驗，程式碼卻寫的很糟糕的程式設計師。經驗很保貴，但只靠經驗是不夠的。就像下棋一樣，假如你用心研究，複習，不斷挑戰自己，也許可以

索引原理和SQL優化（轉載待整理）

索引的本質 MySQL官方對索引的定義為：索引（Index）是幫助MySQL高效獲取資料的資料結構。提取句子主幹，就可以得到索引的本質：索引是資料結構。我們知道，資料庫查詢是資料庫的最主要功能之一。我們都希望查詢資料的速度能儘可能的快，因此資料庫系統的設計者會從查詢演算法的角度進行優化。最

安全站點導航（感謝backlion整理）

個人技術部落格：國內：危險漫步 luan http://www.blogsir.com.cn/ （江sir） http://blog.csdn.net/qq_27446553/ （qq_27446553部落格） http://0

Python工具庫（感謝backlion整理）

漏洞及滲透練習平臺： WebGoat漏洞練習平臺： https://github.com/WebGoat/WebGoat webgoat-legacy漏洞練習平臺: https://github.com/WebGoat/WebGoat-Legacy zvuldirll漏洞練習平臺

Python 3 學習（二）—— 常用內建函式（網上收集整理）

文章目錄輸入輸出數學運算型別轉換序列操作函式操作 Python 3 所有內建函式輸入輸出 print(*objects, sep=' ', end='\n', file=sys.stdout,

OkHttp五大攔截器（自己專業整理）

一、什麼是OkHttp3 （1）定義： OkHttp3是一個處理網路請求的開源專案，是目前最火的網路框架，作者是Square公司，用於代替Android提供的HttpConnection和HttpClient。** （2）OkHttp的特點 1、是基於

機器學習十大經典演算法之決策樹（學習筆記整理）

一、決策樹概述決策樹是一種樹形結構，其中每個內部節點表示一個屬性上的測試，每個分支代表一個測試輸出，每個葉節點代表一種類別。決策樹是一個預測模型，代表的是物件屬性與物件值之間的一種對映關係。最初的節點稱為根節點（如圖中的"顏色"），有分支的節點稱為中間節點

Linux常用命令（不定期整理）

參考連線系統性能 1、top : 動態實時顯示cpu、記憶體、程序等使用情況 2、df –h : 檢視系統記憶體及虛擬記憶體使用情況 (遇到磁碟已滿的情況) 3、du –sh * : 檢視目錄檔案大小 4、fdisk -l | grep Disk : 檢視

MySQL主庫已經存在的基礎上搭建從庫的過程-- （舊資料整理）

【備註】:主機192.168.250.20備機192.168.250.40主從複製1 主機上面已經有了MySQL5.1.53-log版.2 備機上沒有mysql資料庫，需要在備機上安裝MySQL5.1.53-log軟體，具體參考svn文件“system\mysql\docume

【PAT】【Advanced Level】題解目錄（按年份整理）

T1 T2 T3 T4 滿分/總人數題號 20170304(100) map 貪心排序 161/774 1124-1

Linux實戰50臺伺服器規模叢集模式之環境搭建準備篇（綜合網路整理）

一、搭建叢集1、採購伺服器、效能測試、不同叢集用什麼配置。2、採購雲服務（雲主機、虛擬機器）。3、採購頻寬、壓力測試。4、採購CDN服務。二、大致架構圖三、規劃1、伺服器規劃伺服器數量作用負載均衡2對訪問網站的流量進行分流，減少流量對某臺伺服器的壓力Web2處理使用者頁面訪問

【Solidity】internal、private、external、public區別（測試後整理）

public與private 對於public和private，相信學過其他主流語言的人都能明白： public修飾的變數和函式，任何使用者或者合約都能呼叫和訪問。 private修飾的變數和函式，只能在其所在的合約中呼叫和訪問，即使是其子合約也沒有許可權訪問。 external和i

TCGAbiolinks（知乎整理）

相關推薦