1. 程式人生 > >什麼是RNA-Seq (RNA Sequencing)

什麼是RNA-Seq (RNA Sequencing)

什麼是RNA-Seq (RNA Sequencing)

2011-07-14

隨著ome為詞尾的各種組學的出現,轉錄組學已經成為了人們瞭解生物資訊的一個重要組成部分。人們使用了許多辦法來掌握轉錄組的情況,主要分為兩類,一類是基於雜交,一類是基於下一代測序技術(Next Generation Sequencing, NGS)。

基於雜交的辦法,主要是依靠印刷有熒游標記探針的基因晶片來實現。比如說基因組晶片,它高密度的集成了解析度高達幾bp~100bp的探針,通過與樣品雜交熒光顯色的辦法來勾畫轉錄組的情況。雖然基因晶片高度整合,並且易於應用,成本低,但是,這一手段高度地依賴已知資訊,這不利於發現新知,同時,它還存在著高背噪,非特異雜交所帶來的無法分辨弱訊號和過飽和訊號的問題。當然,在不同樣品的比較當中,甚至在同一晶片內部,都存在雜交不均勻帶來的各種問題,需要諸如標準化等統計學手段來分析結果。

隨著下一代測序技術的成熟,它很快就被應用到轉錄組學的研究上來,並被寄以厚望。相比於雜交來說,測序技術直接針對的是cDNA進行測序,所以基分辯率在理論上可以達到單鹼基的水平。然而這在高通量的要求之下變得比較困難。人們使用deep-sequencing技術來解決這一問題。深度測序,顧名思意,其是基於已有的基因組水平上的測序,也就是說它需要完整的參考序列。從這個意義上來說,它也是依賴已知資訊的,但是它不象基因晶片那來,還需要依賴開放閱讀框ORF,或者外顯子exon等資訊。當然,你沒有模板序列也一樣能完成測序這一步,只不過比較麻煩的事情就變成了如何來拼接這些序列了。第二,對於Alternative splicing events以及SNP的研究也較基因晶片來說方便的多。第三,背噪小,不存在飽和問題。因為是基因於測序的,所以它可以很準確地比對到固定的基因組序列上去。當然,也不擔心飽合問題,因為它是數個數的。這一點也直接導致了它的精確度比基因晶片要高,並且可重複性好。第四,它不需要克隆步驟,所以它對樣品量的要求更低。

但是深度測序也是有其不足的。首先是樣品準備方面的。除了人為的操作差異外,還有其過程中必然帶來的誤差。Deep-sequencing只適用於小片段,對於small RNAs(microRNAs(miRNAs), Piwi-interacting RNAs(piRNAs),..)來說,挺方便,但對於轉錄的RNA來說,就需要一個打碎成小片段的過程了。一般來說,分兩種手段,生化的(水解RNA或者酶切cDNA),物理的(霧化RNA或者超聲波cDNA)。每種手段都有它的難度和傾向性。拿生化方法來說,對於RNA水解來說,3’及5’端都不容易保留,反而中間的部分容易保留下來。而DNaseI酶切cDNA就會出現3’端訊號較強的現象。還有,如果構建cDNA庫的話,又會引入逆轉錄或者PCR,不構建的話,RNA又極易降解。這些都會影響到實驗的可重複性。還有一個問題就是,因為片段很小,如果基因組上出現overlapping的話,就不好註釋,如果正好是方向相反的話重疊,就更會影響到註釋結果了。解決辦法是構建一個單鏈庫。但是單鏈庫的構建步驟多,甚至有較難的RNA-RNA連線步驟,沒有實現商業化。而且,單鏈庫對於反義轉錄無能為力。

 

其次,是生物資訊學方面的。凡是高通量的東西,都存在一個數據挖掘的問題。質量控制是第一步,如何從海量資料中去除低質量的測序結果就是問題。第二步拼接。拿到高質量的測序資料之後,需要把少則30,多則上百的片段比對拼接到模板基因組上去。現有的程式包括ELAND, SOAP, MAQ以及RMAP等。我們知道,對於RNA來說,它會有一個ployA的尾巴,它還會有拼切剪接,它會有junction,這同DNA比對拼接就有很大的不同。其次,因為片段很小,而基因組很大,總是會有許多片段會比對到多個位點上去。當然這些都有解決辦法,只不過只要是演算法,就總有完善的空間。最有效的手段還是提高測序長度。

其三就是測序深度與花費的矛盾。有錢當然好辦,基因組再大,加大測序深度就好了。但是深度測序是很花錢的,加大測序深度並不是所有實驗室都可以承受,而且值不值得也是個問題。

RNA-Seq有著巨大的應用前景。比如說它可以明確基因或者外顯子的邊界。一次RNA-Seq就可以明確大量的基因和外顯子邊界。比如它可以擴充套件對轉錄複雜性的認識。對於人類而言,RNA剪接事件已經被確認的就有31618,還有更多有待我們去解,尤其是各類疾病成因的研究。比如它對低頻度轉錄事件的發現。這無疑是對生物噪音研究的一大利器。

因為RNA-Seq是可以定量的,所以在系統生物學方面,也會成為極為重要的手段。

FURTHER INFORMATION
Gerstein laboratory homepage:
http://bioinfo.mbb.yale.edu
snyder laboratory homepage: 
http://www.yale.edu/snyder
454 Life science: http://www.454.com
Applied Biosystems: www.appliedbiosystems.com
Helicos Biosciences: http://www.helicosbio.com
illumina: http://www.illumina.com
illumina forum:
http://www.illumina.com/pagesnrn.ilmn?iD=245
seQanswers:
http://seqanswers.com/forums/showthread.php?t=43