1. 程式人生 > >circos 視覺化手冊-plots 篇

circos 視覺化手冊-plots 篇

歡迎關注微信公眾號《生信修煉手冊》!

不論是highlights還是links,展示的都是染色體上某段區域的資訊,在實際的資料中,除了區間資訊外,還會有該區間對應的資料資訊,比如測序深度等資訊。對於這種資訊,通常我們會通過散點圖,折線圖等圖表來展現,在circos中,也有對應的功能,通過plots這個block , 可以在資料對映到二維座標系中,然後通過不同的圖表型別來呈現。

plots需要的資料格式如下
在這裡插入圖片描述
共4列,空格分隔;前3列定義座標,包括染色體,起始和終止位置;第4列定義對應的值。在這個檔案中,有兩點需要注意

  1. 區間資訊可以是一個點,檔案的第2列和第3列定義起始和終止位置,但是起始和終止位置可以相同;
  2. 第四列的資訊不僅是數字,也可以是文字。數值可以使用散點圖等展現形式,文字可以直接標記在圖上。

plots的基本用法如下:
在這裡插入圖片描述
circos中,基本都是通過一個圓環來展示資料的,r0r1分別定義圓環的內徑和外徑,肯定是必須的。這裡有兩個新的引數maxmin, 對於散點圖等圖表來說,是需要一個座標系的 ,file檔案中的前3列定義了橫座標,縱座標就是通過這裡的maxmin來定義;maxmin分別定義了縱軸的最小值和最大值,通過將file檔案中的第四列的值對映到這個範圍,就可以確定在圖上的位置。

type定義圖表型別,對於plots而言,有以下型別

1. scatter

scatter代表散點圖, 展現形似如下
在這裡插入圖片描述

2. line

line 代表折線圖, 展現形式如下
在這裡插入圖片描述

3. histogram

histogram代表直方圖,展現形式如下:
在這裡插入圖片描述

4. heatmap

heatmap代表熱圖,展現形式如下

在這裡插入圖片描述

5. text

text 直接在圖上標記文字,展現形式如下
在這裡插入圖片描述
plots 中,還有兩個比較特殊的圖表型別,其資料格式和之前的幾種型別都不太一樣。

1 . tile

tile用於展示染色體區域分佈,通過邊距,使得相鄰區域不會重疊,其展現形式如下:
在這裡插入圖片描述

2. connector

connector用於展示染色體上兩個位置之間的聯絡,它需要的檔案格式有點特殊,後續我會詳細講述,其展現形式如下:
在這裡插入圖片描述

上述就是plot的基本概念和展現形式。在實際使用中,plots還可以結合backgrounds, axes, rules 來使用,使圖片更加美觀。

由於plots中的圖表型別過多,每種型別又有很多的細節,針對每種圖表型別,在接下來的文章中再單獨介紹。

掃描關注微訊號,更多精彩內容等著你!
在這裡插入圖片描述